全文検索システムEstraierをMacOSXで使ふ


 ハードディスクの中にいつの間にかファイルがたくさん溜まってしまひ、どこに何があったのか探すのが大変といふことになるのはよく聞く話で、特に研究者の場合、参考論文のファイルが増えて整理に困るといふことが日々の仕事において切実な問題になってゐるのではないでせうか。そこで、ここではEstraierを使った論文検索方法を紹介しませう。
 私も論文のpdfファイルをダウンロードしてゐたら、気がつくと1800くらゐのファイルが溜まってゐて、雑誌名と刊行年や分野名でフォルダに分けても、どうにも収拾がつかなくなってきました。そこで、ファイルを分類して保存するのをやめて、一つのフォルダに1800個まとめて入れてしまって、あとは内容を検索して見つけることにしました。使ふのはEstraier。この特徴は、以下のやうなことが挙げられるさうです。
1. 検索が高速である。2. 検索結果が見やすい。3. 関連文書検索ができる。4. 様々な言語が扱える。5. 様々なファイル形式が扱える。6. 大量の文書を扱える。7. 導入が簡単である。
 素晴らしい。早速使ってみませう。

 ここからファイル(Source Package)をダウンロード。Version 1.2.25以降なら、デスクトップに展開して、説明書のとほりに、./configure --> make --> make check --> make installと進めれば大丈夫です。(一時期、makeのところでエラーが出て、先に進めませんでした。Makefileの43行目にあたりにある「-ansi」を取ればその問題は解決したのですが、今はこんなことをする必要はありません)。あとは説明書に従ってインデックスを作って検索するだけです。

 pdfファイルを検索するときは、estindex register -tsuf "" -hsuf "" -msuf "" -xsuf .pdf application/pdf estpdfhtml casketとすればよいのですね。予めpdftotextをインストールしておく必要がありますが。pdftotextはここからxpdfのsource codeをダウンロードしてインストールします。MacOSXでも問題なくインストールできました。

 estsearch.cgiにWWWブラウザでアクセスして検索したい言葉を打ち込めば、結果が表示されるといふわけです。こんな感じに。ちなみにこれは論文ではなくて、ロード・ダンセイニの『三半球物語』といふ短篇集ですが。「night」といふ単語を入力してみた結果です。

検索結果

 検索語が強調表示されてゐて、ファイル名をクリックすれば目的のファイルが開きます。その他、細かいことは、説明書を読んでください。

2004年11月14日


Apple Store


サーチ:
Amazon.co.jpアソシエイト



ホームページに戻る