検索エンジンの使い方

ここでは体系だってはいませんが、検索エンジンを使う際のヒントを紹介しようと思います。

  • ロボット型検索エンジンとディレクトリ型検索エンジンの使い分け

    まず、ロボット型検索エンジンとディレクトリ型検索エンジンの使い分けについて、やや独断的なところがありますが、まとめてみました。すでに説明したように、典型的なディレクトリ型検索エンジンであるYahoo!Japanにもロボット型用の検索ボックスがあり、これはGoogleと提携しています。また、典型的なロボット型検索エンジンとして説明したgooやGoogleにもディレクトリ機能があります。したがって、ほとんどの場合Yahoo!JapanかgooまたはGoogleかという二者択一にはなりません。どちらを使っても同じ結果を得ることは可能です。
    しかし、「検索エンジンとは」で述べたように、元々できた時の目的・仕組みが違うので、やはり「使い勝手」や「味わい」は違います。

    ディレクトリ型検索エンジン

    ロボット型検索エンジン

    まずWebサイトのホームページに行きたい。そこから順に求めている情報にたどり着きたい。

    求めている語句を含むページに直接行きたい。

    探そうとしている情報があいまい。あいまいなアイデアをもとにガイドしてほしい。

    探しているものが明確で早く情報を得たい。

    とくにあてもなく、気ままにネット・サーフをしたい。

    時間がない。とにかく早く見つけたい。

    音楽や映画に関するおもしろいサイトを探したい。

    たとえば、Yahoo!Japan(以下同じ)でエンターテインメント>音楽>ヒットチャートとたどっていくと、「チャート梁山泊」というおもしろいサイトにたどりつくことができる。

    音楽や映画に出てくる特定のフレーズを探したい。

    確か「…夜霧の日比谷…」というフレーズが入った歌があったが、歌った歌手と題名が思い出せない。Google(以下同じ)で"夜霧の日比谷"を検索すると、検索結果のトップに「流行歌懐古館(TAT)」というサイトの「昭和流行歌一覧・10」というページが示される。開くまでもなく、ページ名のすぐ下に抜粋されているキーワードが一致した部分のテキストを見るだけで、新川二郎の「東京の灯よいつまでも」だったことがわかる。

    主要な業界紙のサイトのリストを作りたい。

    メディアとニュース>新聞>業界紙とたどるかメディアとニュース>ビジネス>新聞とたどるか、どちらでも25のサイトが検索結果として現れる。

    新聞のコラムで読んだ内容を引用したいが、筆者も新聞名も思い出せない。

    「蚊帳」「アフリカ」「インターネット」というキーワードを思い出したので、その3語を含むページを検索すると、検索結果の5番目に「最近のニュース」というページがあり、2001年8月10日付けの朝日新聞《天声人語》だたことがわかる。

    どんな引越し業者があるのか探したい。ディレクトリーをイエローページのように使えばよい。

    たとえば、ビジネスと経済 > 企業間取引 (BtoB) > 運送、物流 >引越し業者、あるいはビジネスと経済 > 企業> 運送、物流 >引越し業者とたどると、48の引越し業者のサイトが検索される。

    特定の商品名がわかっているとき。

    たとえば、どの会社のサービス名かわからないが引越しは「プロコンポ」がよいと言われた。これを調べたい。「プロコンポ」を含むページを検索すると、検索結果のトップに「プロコンポ」という求めているものそのものが出てくる。日通のサービスであることがわかる。「プロの梱包!」ということらしい。

    有名芸能人のサイトを探したい。

    たとえば、松たか子のオフィシャルサイトを探す場合には、エンターテインメント > 芸能人、タレント > 俳優、女優 >国内とたどり、「松たか子 Official Web Site」を見つけることができる。

    あまり有名でない人物について調べたい。これはディレクトリーでは無理。

    たとえば、野津和博という俳優について知りたい。ストレートに検索すると、検索結果は2件、「団員のプロフィール」というページと「タイムイズハニー平成浦島伝説」というページが出てくる。劇団年輪に所属、昨年の公演で浦島老人を演じたことがわかる。その下に「最も的確な結果を表示するために、上の2件と似たページは除かれています。検索結果をすべて表示するには、ここから再検索してください。」とあり、「ここから再検索してください」の文字をクリックすると、さらに7件のページが示される。すべて「稽古場日誌」と称するページで、ここに野津さんの日誌がでており、人となりがわかる。

    料理に関するサイトを調べたい。

    生活と文化 > グルメ、ドリンク とたどると、イベント (4)、レストラン・飲食店情報、栄養、各国料理、各種食品・料理など全部で21のカテゴリーが見つかる。この中で興味をひくものをさらにたどっていけばよい。

    特定の料理のレシピを調べたい。

    たとえば、エッグ・ベネディクトのレシピがほしい場合は、「エッグ・ベネディクト」「レシピ」の2つのキーワードを入れて検索すると、検索結果の3番目「USMEFアメリカン・ミートレシピ」というページに写真入りでレシピが手に入る。

    京都府にある大学のリストがほしい。

    日本の地方 > 近畿 > 京都府 > 教育 >大学、あるいは教育 > 大学 > 都道府県別一覧 > 京都府、と下ると28のサイトリストにたどりつく。

    民法学の星野英一先生の「民法論集」は第何巻まで出版されているのか調べたい。

    「星野英一」「民法論集」の2つのキーワードで検索すると、検索結果4番目「書籍詳細情報」(有斐閣のサイトの中にある)というページに1999年に第9巻が出版されたとある。

    癌の治療に関する情報を集めたい。闘病記も読んでみたい。

    健康と医学 > 病気、症状 > 癌、と下ると28の癌に関するサイトが見つかる。上から8番目の「「がん克服」総合リンク集」によってさらに多くのサイトを見つけることができる。健康と医学 > 病気、症状 > 癌 > 闘病記と、運良く「闘病記」というカテゴリーがあり、そこに22のサイトがリストアップされる。

    医者が処方してくれたジスロマックⓇという薬について調べてみたい。

    単に「ジスロマック」をキーワードとして検索すると、検索結果のトップに、この薬を開発したファイザー製薬のプレスリリース(「ニュース・リリース 2000年5月22日」)が見つかる。一般名称はアジスロマイシン水和物。抗生物質で、1日1回、3日服用すれば約7日間作用が持続するとある。検索結果の3番目には、磯部浩昭さんのホームページ「薬のメモ」の中のページ「アジスロマイシン水和物で注意したいこと」があり、副作用の可能性などについて説明している。

    シェークスピアに関する論文を探したい。これは、本場のYahoo!を使ってみる。

    Arts > Humanities > Literature > Authors > Playwrights > Shakespeare, William (1564-1616) > Web Directoriesまで進むと、”Mr. William Shakespeare and the Internet”という、Web上で見ることのできるシェークスピアに関する学術的なリソース・リストにたどりつく。

    ハムレットの有名なせりふ"To be, or not to be: that is the question:"は第何幕の第何場だったか調べたい。できればその前後のテキストを読んでみたい。

    To be, or not to be: that is the question:というフレーズを""でくくり、1つのキーワードとして検索すると、検索結果のトップに「The Complete Works of William Shakespeare」というサイトの中の「SCENE I. A room in the castle.」というページが表示される。このページには、HamletのAct3、Scene1(第3幕、第1場)の全文が収められている。欧米における古典の電子化テキストの充実ぶりには感動する。あとは、エクスプローラーの「編集」→「このページの検索」で"To be, or not to be: that is the question:"の在り処をさがせばよい。

    Windows用のフリーウェア・シェアウェアに関するサイトを見つけたい。

    コンピュータとインターネット > ソフトウェア > リンク集と総合情報、とたどると、フリーウェア、シェアウェアに関するサイトが見つかる。また、「Yahoo!コンピュータ - フリーソフト&シェアウェア」というコンテンツがあり、ここでも様々なフリーウェア、シェアウェアがダウンロードできる。

     

    "システムリソースが極端に不足しています"というエラーメッセージがよく出て困っている。マニュアルを読んでも書かれていない。どう対応すればよいのか調べたい。

    「システムリソース」をキーワードとして検索すると、たまたま運良く、11,900件の検索結果のうち、トップ3に表示されているページはいずれも疑問に答えてくれる内容。特に、3番目の「Windows.FAQ - システムリソースって何?」は、どうすればシステムリソースを解放できるか技術的なことも詳しく参考になる。実は、実際に困っていたので大変役にたった。もっとストレートに"システムリソースが極端に不足しています"を1つのキーワードとして検索してもよい。しかし、検索結果19番目の「Re:システムリソースの不足・・・ - V70NA ...」まで解放のテクニックをわかりやすく示したものはなかった。一般的には、できる限り、キーワードは特定した方がよいので、後者の検索方法をとるべき。

    南アフリカへの旅行ガイド的なサイトを見つけたい。

    地域情報 > 世界の地方 > アフリカ > 趣味とスポーツ > 旅行 > 南アフリカとたどると、「南ア・ツアーズ」というサイトが見つかる。ツアーの案内もあるが、見所などを要領よくまとめてある。

     

    南アフリカで蒸気機関車に乗って旅をしたい。

    「南アフリカ」「蒸気機関車」「旅行」をキーワードとして検索すると、検索結果のトップに「豪華蒸気機関車 ロボスレイルと南アフリカ・サファリの旅」というページが示される。まさにブルー・トレインに対抗した蒸気機関車を使うツアーの案内である。

  • ブール演算子の活用

    ロボット型検索エンジンでは、キーワードに対して、大量のページが検索されることがよく起こります。検索されるページが多いと、どのページにアクセスして求める情報を見つけてよいか分からないということは多くの人が経験していると思います。こんな場合に役に立つのが,ブール演算子(Boolean operator)と文法(syntax)による絞り込みです。逆に、演算子を使用すると,1つのキーワードでは検索されるページが少ないときに,複数のキーワードを一度に検索することも可能となります。

    使う演算子は、ANDORNEARの二項演算子(binary operator)とNOTの単項演算子(unary operator)の4種類です。ただし、検索エンジンによって、使える演算子と使い方が微妙に異なっているので注意が必要です。お使いになる検索エンジンのオンライン・ヘルプに自分で当たって確認して下さい。

    主要な検索エンジンの演算子一覧

    検索エンジン名 AND OR NOT
    infoseek スペース/AND/+ OR
    goo スペース/AND/and/& OR/or NOT/not/−
    AltaVista AND/and/& スペース/OR/or/| AND NOT/and not/!
    フレッシュアイ スペース/AND/and/& OR/or/| NOT/not/~
    Google スペース (設定で選択)
    Excite Japan スペース/+ OR
    Yahoo!JAPAN

    ブール演算子による検索にこだわりをもつAltaVistaでは、これらの演算子はandornearnotの小文字でもかまわいませんし、ANDの代りに「&」、ORの代りに「|」、NEARの代りに「~」、NOTの代りに「!」の記号を用いてもかまいません。
    逆に、Googleは演算子を使って絞り込むという作りにはなっていません。だからと言って絞り込みができないというわけではありません。「検索オプション」という特別の検索ボックスを用意していてそこで同じことが行えます。演算子を使ってはいませんが、検索エンジンがやっていることは同じなのです。ですから、どの検索エンジンを使うにせよ、考え方は理解しておいた方が効果的な検索が可能になります。

    二項演算子だの単項演算子だのというと拒否反応を示す人が多いかもしれませんが、要は小学校か中学校で習ったベン図を思い出して下さい。

    A、Bの2つの集合がある場合、

      @AとBの両方に含まれる集合は  A AND B
      AAとBの少なくともどちらか一方に含まれる集合は  A OR B
      BAに含まれるがBには含まれない集合は  A NOT B
    という演算式で表されます。これをベン図で表すと次のようになります。
        

    たとえば、「東京の学校」という集合と「大学」という集合があったとします。

      @東京の学校 AND 大学  は、「東京の学校でかつ大学」ということですから、慶応大学や早稲田大学が含まれる集合になります。日比谷高校や同志社大学は含まれません。
      A東京の学校 OR 大学  は、「東京の学校または大学」ということですから、慶応大学や早稲田大学はもちろんのこと、日比谷高校や同志社大学も含まれる集合となります。
      B東京の学校 NOT 大学  は、「東京の学校から大学を除いた」集合ですから、日比谷高校は含まれますが、慶応大学や早稲田大学は含まれません。当然、灘高校や京都大学は含まれません。

    これが一般的なブール演算ですが、当然ながら、検索エンジンで使う演算は若干意味が異なります。東京の学校 AND 大学  は、「東京の学校」というキーワードと「大学」というキーワードの両方が含まれているページを検索するという意味になります。したがって、「東京の学校」と「同志社大学」が含まれているページは検索結果にあがってきます。また、
    公立大学 AND 私立大学 は、一般的に「公立大学であってかつ私立大学である」ことはありえないので、いわゆるゼロ集合となりますが、検索エンジンに 公立大学 AND 私立大学 と入力して検索すると、公立大学というキーワードと私立大学というキーワードの両方が含まれているページが検索されるわけで、これはかなりの数がヒットすると思います。
    要すれば、検索エンジンで使うブール演算は、「キーワード含まれているページの集合」を処理するものです。

    この演算子を組み合わせることによって、検索結果を絞りこんでいくことができます。

    NEARAltaVistaで使うことができる特殊な演算子です。A NEAR B はAとBがお互いに10語以内に(within ten words of each other)含まれているドキュメンツを検索することができます。A AND BではAとBが同じページに含まれていればAとBの関係にかかわらず全てリストアップされてしまいますが、NEARを用いることでAとBの関係が強いものに検索結果が絞られるのです。ひじょうに便利です。
    ただし、日本の検索エンジンの説明の際に触れましたが、Googleは、複数のキーワードを半角スペースで繋ぐことによって、キーワード全てが含まれるページを検索し、かつ、そのページ内でそれらのキーワード間の近接度に従って検索結果の順位付けを行っています。キーワードが近くに一緒にまとまっている検索結果ほど優先されるのです。つまりGoogleに複数のキーワードを入れると自動的に「AND」検索になり、また「NEAR」検索的な機能も発揮していることになります。

    演算子の使い方を練習してみましょう。

    フリーウェア AND シェアウェア
    「フリーウェア」と「シェアウェア」のいずれのキーワードも(both)含まれているドキュメンツ(ページ、以下同じ)を検索する。gooで検索すると検索結果は約14,019件となった。

    フリーウェア OR シェアウェア
    「フリーウェア」と「シェアウェア」の少なくとも一方が(at least one)含まれているトキュメンツを検索する。gooで検索すると検索結果は約95,609件となった。

    ビッグバン NOT 宇宙
    「ビッグバン」を含むドキュメンツから「宇宙」を含むものを除いたドキュメンツを検索する。あるキーワードを検索する場合で、明らかに不要なものを予め除く場合に有効。ビッグバンという言葉はもともと宇宙が膨張するきっかけになった大爆発のことを意味するが、今調べたいのは金融ビッグバンと呼ばれるものなので、「宇宙」という言葉を含むドキュメンツは最初から除外して絞込みをかけているわけである。ちなみに、gooで検索すると、検索結果は22,585件となった。まだ多いが、もしもこれを単に「ビッグバン」というキーワード1語で検索してたら28,667件の検索結果が出てきたわけで、約6,000件を最初から除外できたことになる。

    ( スターウォーズ AND 剣 ) OR ( starwars AND 剣 )
    ( スターウォーズ OR starwars ) AND 剣
    スターウォーズに出てくる剣の名前を知りたいときには、上のように( )を使って検索するとうまくいく。スターウォーズ AND 剣だけでは、STARWARSと表記されたページが漏れてしまうからだ。因みに、キーワードはSTARWARSとするより全て小文字でstarwarsとする方がよい。starwarsはSTARWARSもStarwarsもstarwarsも全て含むが、逆はそうでないからだ。

    インターネット AND (入門 OR 初心者) NOT セミナー
    インターネットの入門的ページを探しているけれど、セミナー関係のページばかり出てきてしまう場合には、上のようにNOTを使って除外する。入門的ページは「入門」と銘打ってあるだけでなく「初心者」の場合も多いので 入門 OR 初心者 としている。因みに演算子の優先順位であるが、NOT → AND → OR である。だから 入門 OR 初心者 は( )で括る必要がある。

    括弧( )を使った演算は慣れないと難しいですが、「AltaVistaの使い方」でもう少し詳しく説明していますのでそちらを参考にして下さい。

  • キーワードの選び方

    ロボット型検索エンジンを使うとき一番重要なのは「キーワードの選び方」です。「何をキーワードにするか」で検索がうまくいくか失敗するかが決まると言っても過言ではありません。

    ポイントは、

    • できるだけ一般用語は使わない。専門用語をキーワードとする。たとえば、Googleで単に「景気」を検索すると、検索結果は244,000件だが、「景気循環」とすると6,110件とぐっと少なくなる。さらに「コンドラチェフの景気循環」とすると3件に絞られる。

    • 複数のキーワードを選ぶ。多くのキーワードを「AND」で結べば結ぶほど絞込みができる。

    • 言い換えを考えてみる。これは逆に検索結果が少なくて、目的のページにヒットしなかった場合に検索結果を増やすためのテクニックだ。上で例にしたように、「入門的なページ」を探す場合、「入門」だけでなく、「初心者」「初級」「ABC」「いろは」などで言い換えてみるとよい。「OR」で結ぶことにより検索するページの漏れが少なくなる。

    (01/27/2002)

    前のページに戻る 「検索エンジンの使い方」の目次に戻る 次のページに進む

    DANchan's Home Page のトップへ戻る