日本の検索エンジン

  • goo
    NTTアド、NTT、INKTOMIの3社の提携により、1997年3月に誕生した日本語のロボット型検索エンジン。登場した頃、そのデータ数は350万ともいわれ、既存の検索エンジンと比べ格段に多かったため、当時私も感動して「日本でもAltaVistaやHotBotのような検索エンジンが使えるようになり大変頼もしい。」と書いた。
    今では、日本語ページのデータベース量は120万サイト・4300万ページ、海外ページは5億ページを誇り、国内最大規模のロボット型検索エンジンである。

    gooは当初典型的なロボット型検索エンジンであったが、その後ディレクトリー検索機能も加えた。ただし、人手でサイトの登録等を行ってデータベースを築き上げる通常のディレクトリーではなく、ロボットが自動的にデータを取得しデータベースへの登録を行っていくという特別なタイプのディレクトリー(gooでは「自動分類ディレクトリ」とか「ロボット型ディレクトリ」と呼んでいる)だ。サイト収集が自動化されているため、データベースの更新頻度も一般のディレクトリーより多くなっている。
    これにあわせ、ページ単位での検索結果を表示していたロボット型検索についても、ページ検索に加えて、サイト単位での検索も可能になった。これはロボット型検索の弊害のひとつ、検索結果が多すぎてなかなか目的の情報にたどりつけないことを解消すべく、サイトのトップページを探しやすくしたものである。さらに、ロボット型検索のデフォルト検索結果表示がサイト検索結果になった。
    しかし、おもしろいことに、gooは2002年1月25日をもって、デフォルト検索結果をもとのページ検索結果に戻した。これは、ロボット型検索エンジンのユーザーはやはりページ検索を求めているのだということだ。
    ちなみに私がgooを使わなくなったのは、検索結果がサイト検索の結果になってからです。また、gooにするべきかGoogleにするべきか悩むことになります。

    尚、goo(グー)という名前は、「global networkが無限大(∞)に拡大し続ける」インターネットの姿をシンボライズし表現しているとのこと。

  • Google★★
    さて、今もっとも人気のある検索エンジンGoogleである。なぜ人気があるかについては、「Googleの人気の秘密」に書かれている通りなのだろうが、繰り返しを厭わずに自分の経験から書いてみると次のようになる。

      おしゃれ。まずは、検索ボックスのあるホームページに無駄なものがなく(これはごちゃごちゃしたディレクトリーがないという私の偏見・好み)シンプルで、格好いい。

      早い。検索時間が短い。検索結果の表示の最後にURL-「キャッシュ」-「関連ページ」とあり、この「キャッシュ」をクリックするとオリジナル・ページを開くより早くページを見ることができる。ロボットが各サイトを訪問して更新したデータが「キャッシュ」として保存されているのだ。したがって最新時点でのページを表示しているわけではないが「このページが自分の検索目的にマッチしているかどうか」を判断するには便利である。入力したキーワードがハイライトされるのもgood。マッチしていると思えば、最新時点でのページを確認すればよい。

      プレビューがわかりやすい。Googleは他の検索エンジンと異なり、Webページの概略ではなく、ユーザーが入力したキーワードと一致するテキストの抜粋を、検索語句にハイライトをつけて検索結果に表示する。このプレビューで、自分が探そうとしているページかどうか目安をつけることができる。

      重要なページが検索結果の上位に表示される。これはGoogleが特許出願中のPageRank(TM)技術によるもので、Webの世界のハイパーリンク構造の特性を活かした検索手段を作り上げている。技術的な興味のある人は、馬場肇さんの「Googleの秘密 - PageRank 徹底解説」を参考にしてほしい。簡単に言えば、多くのリンクが張られているページほど人気がある、つまり重要だという原則に基づいて、重要性を判断しているわけだ。たとえば、私はこのページから馬場さんの「Googleの秘密 - PageRank 徹底解説」にリンクしたが、これによって私が馬場さんのページに1票投じたことになるのだ。

      目的にあったページが検索結果の上位に表示される。Googleではページ内での各キーワードの位置が重視される。
      AltaVistaに代表されるように一般的に検索エンジンは複数のキーワードをスペースで区切って入力すると「OR」検索になるが、Googleの場合「AND」検索となる。つまり、キーワードとして、

      アフガニスタン タリバン ビン・ラディン
      と入力すると、AltaVistaでは、
      アフガニスタン OR タリバン OR ビン・ラディン
      を意味するが、Google では、
      アフガニスタン AND タリバン AND ビン・ラディン
      を意味する。
      Googleは原則「AND」検索なのだ。これは慣れるととても便利(もっともAltaVistaを愛用していたからで、最初からGoogleを使っている人には当たり前ということになるが)。どんどんキーワードを加えて絞り込みができるからだ。ただし、キーワードの順番は検索結果に影響するので厳密な「AND」検索ではない。さらに、Googleは、入力したすべてのキーワードを含むページを検索する(これが一般的な「AND」検索)だけでなく、そのページ内でそれらのキーワード間の近接度も分析する。 他の多くのサーチ エンジンとは異なり、Google ではキーワードの近接度に従って検索結果の順位付けを行う。キーワードが近くに一緒にまとまっている検索結果ほど優先されるので、関係のない結果を排除する手間を省くことがでる。つまり、単なる「AND」検索ではなく、AlaVistaなどで言う「NEAR」検索に近いのだ。これを敢えてAdvanced Searchとせずに、デフォルトで行うところがすごい。

    検索結果の見方については、こちらを参照のこと。

  • infoseek
    1996年10月、(株)デジタルガレージが、米国インフォシーク社と業務提携を行い、インフォシークの実験的サービス提供開始。1997年2月インフォシークが正式にオープン。1999年6月、米国インフォシーク社の100%子会社として株式会社インフォシークが正式に営業開始したが、2000年12月に楽天株式会社が、株式会社インフォシークの株式100%を取得。
    オンライン・ヘルプの「検索コマンド一覧」はわかりやすい。

  • excite
    1997年12月にサービスを開始。2002年1月7日より、米国Google社と提携し、ページ検索についてはGoogleの検索結果を利用するようになった。
    特色は翻訳検索サービス。検索ボックスの下の「翻訳」ボタンをチェックした後、キーワードを日本語で入力して検索を実行すると、キーワードを英語に翻訳した上で英語のサイトを検索し、結果を日本語で表示する。検索された英語のページを日本語に翻訳してくれる。辞書を引きながら英語のサイトを読むのに苦戦するなら、(ひどい翻訳ではあるが)ずっとこの機能を使う方がよい。

  • フレッシュアイ
    東芝、凸版印刷、電通が株主となっている会社フレッシュアイが運営する新しいロボット型検索エンジン。一般的にロボット型検索エンジンは新しい情報に弱い。なぜなら、ロボットがWeb上を巡回しデータベースを更新しているのだが、どうしても1ヶ月程度巡回にかかってしまう。そうすると、今一番知りたい最新情報が更新できていないことが多い。フレッシュアイの「売り」は、今日の情報、最近1〜2週間の情報を検索できるということだ。1ヶ月以内に登場/更新したWebページだけに絞って検索している。

  • Yahoo! Japan
    老舗Yahoo!の日本語版。本家Yahoo!に比べると登録ページ数が圧倒的に少ないのが難だが、本家Yahoo!にない特色もある。お勧めページがメガネマークで表示されているのがよい。
    典型的なディレクトリー型検索エンジンで使い方は難しくないが、オンライン・ヘルプを一度読んでみるとよい。

    (01/27/2002)

    前のページに戻る 「検索エンジンの使い方」の目次に戻る 次のページに進む

    DANchan's Home Page のトップへ戻る