지난번 구글 데스크톱을 설치했다가 hwp 파일이 색인조차 되지 않는 사실을 확인한 이후
hwp 파일의 내용 검색을 할 수 있는 방법에 대해 다방면으로 조사를 해보았다.
그 결과 구글 데스크톱이 이유없이 작동하지 않는 현재로서는 두 가지 방법밖에는 없는 것으로 보인다.
(댓글에 달린 hwp를 검색할 수 있는 플러그인이 있다는 언급은 사실이 아닌것 같다. 예전 구글 데스크톱 2.0 시절에는 구글 데스크톱에서 hwp 파일 검색을 공식적으로 지원하지 않아 플러그인으로 검색을 했지만, 그 이후 hwp 파일은 기본지원하면서 플러그인은 없어졌다.)
대안 1 : 문서찾기
우선 생각해 볼 수 있는 것이 한글과 컴퓨터사에서 직접 만든 문서찾기 프로그램.
아래한글을 설치하면 자동으로 같이 설치되는 프로그램이라 우선 급한대로 그럭저럭 쓸 수 있다.
하지만, 문서찾기 프로그램은 작업표시줄(시작-프로그램)에서는 문서찾기 파일을 찾을 수 없고,
아래한글을 실행한 후 파일-문서찾기…로 들어가야 실행이 가능하다.
물론 아래한글의 메뉴에 들어있기는 하지만, 별도의 프로그램으로 돌아간다.
사용해본 결과는 본문에 포함된 문자열을 찾는 것은 어느정도 만족할 만한 수준인 것 같다.
그런데,
문서찾기 프로그램이 문서를 검색하는 시간과 검색하는 동안의 CPU 사용량은 어마어마하다.
hwp 파일 2만여개가 있는 컴퓨터에서 문서검색에 걸리는 시간은 20~30분이고,
그 시간동안 다른 작업이 곤란할 정도로 컴퓨터 속도가 느려졌다. -_-;
물론 밑에 있는 색인으로 빨리 찾기를 선택하면, 한꺼번에 색인을 만들어 두고
문서 검색할 때마다 파일을 일일이 뒤질 필요없이 바로 색인에서 찾을 수도 있지만,
색인으로 빨리 찾기로는 제대로 검색이 되지 않는다.
이건 아래한글에 문서 찾기가 처음 들어갔을 때부터 그래왔는데 절대 개선되지 않고 있다.
게다가 이 프로그램을 사용하는 것이 망설여지는 가장 결정적인 이유는 설명이 부실하다는 것이다.
AND 검색, OR 검색이 가능하기는 한건지? 색인은 어떤 파일을 대상으로 어떻게 만들어지는지,
그 어디에서도 설명을 찾을 수 없었다.
대안 2 : 코난 데스크톱 검색
구글 데스크톱과 유사한 기능을 하는 검색 프로그램으로는 Copernic Desktop Search 3(코페르닉 데스크톱 검색)과 MS에서 만든 Windows Search 4.0 그리고 국산으로 코난 데스크톱 검색이 있다.
그러나 앞의 두 외산 프로그램은 hwp와 같은 국내에서 자주 사용하는 파일을 인식하지 못해 단지 그냥 파일이름 검색과 다를 바 없고, 내용을 검색하지는 못한다.
국내에서 개발된 코난 데스크톱 검색은 예전에 엠파스와 협력해서 엠파스 데스크톱 검색이라는 이름으로 배포되기도 했는데, 현재는 엠파스에서 관련 서비스를 종료해서 더이상 나오지는 않는다.
다만, 현재에도 개인사용자는 코난 테크놀로지사 홈페이지에서 코난 데스크톱 검색 프로그램을 내려받아 무료로 사용할 수 있다.
일단 hwp 파일 검색에서는 현재 나온 프로그램들 중 가장 나은 성능을 보여 준다.
하지만, 일반적인 검색은 조금 불편한 점이 있었다.
1. 공백문자(화이트 스페이스)로 분리된 문자들은 모두 AND 검색으로 처리하고, 공백을 포함한 특정한 문구를 따옴표로 묶어 검색하는 방법은 없었다. (이건 구글 데스크톱도 마찬가지. 구글 웹 검색은 따옴표로 묶어 검색하는 것이 가능)
2. 지원하는 브라우저에 파이어폭스도 포함되어 있지만, 파이어폭스로 방문한 웹 페이지는 전혀 검색되지 않았다. 게다가 검색결과 페이지는 자바스크립트로 작성되어 있는데, 파이어폭스에서는 작동하지 않는 경우가 종종 발생한다.
3. 이메일도 아웃록 계열만 검색가능하고 썬더버드나 그밖에 유명 메일 프로그램은 전혀 다루지 못한다.
4. 네이트온과 같이 국내에서 많이 사용하는 메신저는 지원 대상에서 제외되어 있고 MSN 계열 메신저와 데이콤 메신저라는 희안한 것만 지원한다. 더군다나 MSN 메신저 버전 7.5 이상은 색인이 원활하지 않다.
5. 압축파일은 zip만 지원한다. rar, alz 같은 파일은 파일명만 색인하고 압축파일에 포함된 내용은 찾지 못한다.
6. 색인, 검색대상에서 폴더명은 제외하고 파일명, 본문내용만으로 검색하기 때문에 검색결과에서 중요한 정보가 빠져있을 가능성이 있다.
그 밖에 구글 데스크톱보다 나은 점은 hwp 파일의 내용검색이 가능하고,
검색에서 제외할 폴더와 검색에서 제외할 파일 확장자를 지정할 수 있다는 것 정도….
색인 제외 폴더를 많이 지정해두면, 입출력되는 파일을 모니터링하는데 소요되는 시스템 자원이 훨씬 줄어들 수 있다.