AltaVistaの使い方

AltaVistaの検索方法には、単純なSimpleQueriesと、検索条件の指定ができるAdvancedQueriesの2つがあります。ただし、現在はSimple Queriesという呼び方はしていません。AltaVistaのページを開くと最初に出てくる検索ボックスがSimple Queriesと呼ばれていたのですが、現在はその検索ボックスを"Main Search Box"と呼んでいます。
このページは、AltaVistaのオンライン・ヘルプを参考にしながら私がまとめたものですが、オリジナルに当たりたいという方は、こちらを参照して下さい。

1. メイン・サーチ・ボックスの使い方
(1) キーワードの入力(基本)
(2) 制限検索

2. Advanced Queries
(1) 演算子の使い方
(2) 括弧の使い方

3. 簡単な検索例

(01/19/2002)

1.メイン・サーチ・ボックスの使い方

(1) キーワードの入力(基本)

AltaVistaのホームページを開くとページの上部に次のような検索ボックスが現れる。

 Search for: Help | Customize Settings | Family Filter is off  
    
Search Assistant | Advanced Search 

半角英数字でキーワードを入力し SEARCHボタンを押すと検索が実行される。
キーワードは小文字で入力した方がよい。小文字の場合には、大文字まで含めてヒットするが、逆に大文字でキーワードを入力した場合には、そのキーワードに完全に合致するものしかヒットしない。たとえば、キーワードparisは、paris、Paris、PARISのいずれかが含まれるドキュメンツを探すが、キーワードPARISは、PARISしか探さない(paris、Parisを含むドキュメンツにはヒットしない)。

1つの単語(キーワード)ではなく、複数の単語を入力する場合には注意を要する。

big bang
単に「big bang」と入力すると、「big」または「bang」という単語のいずれかが含まれる全てのドキュメンツが検索される。後から説明するAdvanced Searchのbig OR bangと同じ。

メイン・サーチ・ボックスでは複数の単語を入力する場合、「""」、「+」、「-」、「*」(いずれも半角)という4種類の記号を使うことができる。

"big bang"
クォーテーションマーク("")でフレーズを囲むと1つの単語として扱われる。つまり、入力した語句に完全に一致する語句を含むページだけを検索する。これは極めてパワフルな機能で、何かの引用を検索したい時などひじょうに便利だ。
実はAltaVistaが登場するまで、たとえば、ハムレットの有名なせりふ「To be or not to be」を検索しようとした場合、「to」、「be」、「or」、「not」のようなキーワードとしてなじまない単語ばかりからなるフレーズを認識できない検索エンジンがあったのだ。

+big+bang
複数の単語を半角の「+」で繋ぐとクォーテーションマークで囲ったのと同じになる。つまり、+big+bangは"big bang"と同じ。

+big +bang
「+」の前に半角スペースを入れると、「big」および「bang」のいずれもが含まれたドキュメンツが検索される。後から説明するAdvanced Searchのbig AND bangと同じだ。したがって、語順には関係なく、+bang +bigも同じである。半角スペースを入れるか入れないかで検索条件は違ってくるので注意が必要。+big+bangの場合にはこの語順でbig bangを含むドキュメンツであるが、+big +bangの場合には語順に関係なくbigとbangの両方の語が含まれていればよい。ちなみに、+big+bangの検索結果が122,113件であるのに対して、+big +bangは398,679件。後者には当然前者が含まれている。念のために、語順を変えて+bang +bigで検索するとやはり398,679件となる。

+big+bang -space
半角「-」を付けるとその後に続く単語を除いたドキュメンツが検索される。後から説明するAdvanced Searchの"big bang" AND NOT spaceと同じ。つまり、「+big+bang -space」は、big bangという語句を含むがspaceという語句を含んでいないドキュメンツを探す。「-」の前には半角スペースを入れなければならないので注意のこと。

big;bang
"big bang"と同じ。単語を半角「;」で繋ぐと、「;」がスペースとなり全体がクォーテーションマーク(" ")で囲まれたのと同じことになる。たとえば、「american;indian;language」は、「"american indian language"」と同じ。

quilt*
「*」はワイルドカードで、いかなる文字列もとりうる。したがって、quilt*は、quilt、quilts、quilting、quilted、quilter等を含むドキュメンツを検索する。スペリングがあいまいなときに使える。たとえば、「飯島 愛」を検索する場合には、"Ai I*jima"と入力すれば、「Iijima」と「Ijima」のどちらもヒットする(実際、両方のスペリングがある)。

(2) 限 検 索

次の文法(syntax)を用いて、制限的に検索することもできる。link、title、imageなどのキーワードのすぐ後にコロン(:)を付ける。

anchor:text
複数のテキスト(ハイパーテキスト)をリンクで関連付けた構造をハイパーリンクという。
anchor:click-here は、ハイパーリンクのテキストの中にclick-hereという語句が含まれるページを検索する。コロンの前後にスペースを入れないこと。
anchor:job +programming は、programmingという語句とリンクにjobという語句が含まれるページを検索する。
anchor:job OR anchor:career は、jobという語句を含むリンク、careerという語句を含むリンクのいずれかを含むページを検索する。

applet:class
Java言語を用いて作られたプログラムのひとつをJavaアプレット(クライアントがブラウザーを用いて読み出し実行できる)という。
applet:NervouseText は、アプレット・タグの中にNervouseTextという名前が含まれるページを検索。

domain:domainname
特定のドメインのページを検索する際に用いる。ドメイン・ネームとはインターネットで組織を表す名前で、ピリオド(.)で区切られた文字列で示す。右端から順に第1レベル、第2レベル、第3…レベルとなり、第1レベルは原則としてアメリカとカナダを除いて国名を示す。
domain:uk は、英国(United Kingdom)のページを検索する。
domain:com は、商業用サイト(commercial sites)を検索する。

host:hostname
host:digital.comは、digital.comというホストネームのWebサーバー(コンピュータ)上にあるページを検索する。
host:dilbert.unitedmedia.comは、unitedmedia.comにあるdilbertというコンピュータにあるページを検索する。

image:filename
image:comet.jpgは、イメージ・タグの中にcomet.jpgが含まれているページを検索。
image:beachesのようにファイル名に拡張子をつけなければbeaches.jpgだけでなくbeaches.gifなども探すことができる。ちなみに、image:beaches.jpgで調べると1,131件、image:beaches.gifで調べると2,727件検索できたが、拡張子なしのimage:beachesで検索すると検索結果は8,316件だった。

like:URLtext
like:altavista.comで検索するとExcite、Google、Lycosなど代表的な検索エンジンのホームページが検索結果にリストアップされる。つまり、altavista.comに似たサイトを検索するのだ。

link:URLtext
link:thomas.gov
は、URLの中にthomas.govという語句のあるページにリンクを張っているページを検索。

text:text
text:algol68は、テキストの中にalgol68という語を含むページを検索する。換言すれば、たとえば、リンクやイメージにalgol68という語が含まれていても検索しない。

tilte:text
tilte:"The Wall Street Journal"は、 ページ・タイトルの中にThe Wall Street Journalという語句を含むページを検索。
ちなみに、title:danchanで検索すると、検索結果のトップにこの「検索エンジンについて」が来ます。

url:text
url:home.htmlURLの中にhome.htmlという語句が含まれるページを検索。

(01/19/2002)

2.Advanced Queries

Boolean query: Help  |  Customize Settings  |  Family Filter is off
   
Sort by:  
More Advanced Search Options Search Assistant | Basic Search

AltaVistaのようなロボット型検索サイトでは,キーワードに対して,大量のページが検索されることがある。検索されるページが多いと、どのページにアクセスしてよいか分からないこともあるだろう。こんな場合に役に立つのが,ブール演算子(Boolean operator)と文法(syntax)による絞り込みだ。また演算子を使用すれば,検索されるページが少ないときに,複数のキーワードを一度に検索することも可能だ。Advanced Queriesは、演算子とキーワードで条件式を作ることにより検索方法を指定する。つまり、演算子による検索である。

使う演算子は、ANDORNEARの二項演算子(binary operator)とNOTの単項演算子(unary operator)の4種類である。これらの演算子はandornearnotの小文字でもかまわない。また、ANDの代りに「&」、ORの代りに「|」、NEARの代りに「~」、NOTの代りに「!」の記号を用いてもかまわない。逆にキーワードの中にこれらの記号を使用する場合には、演算子として認識されないように、クォーテーションマークで囲む必要がある。

二項演算子だの単項演算子だのというと拒否反応を示す人が多いかもしれないが、要は小学校か中学校で習ったベン図を思い出してもらえばよい。
A、Bの2つの集合がある場合、
@AとBの両方に含まれる集合:A AND B
AAとBの少なくともどちらか一方に含まれる集合:A OR B
BAに含まれるがBには含まれない集合:A AND NOT B (一般的にはA NOT Bで表されるが、AltaVistaではA NOT Bはエラーとなるので注意)
という演算式で表される。これをベン図で表すと次のようになる。
  

この演算子を組み合わせることによって、検索結果を絞りこんでいくことができる。
NEARは特殊な演算子で、A NEAR B はAとBがお互いに10語以内に(within ten words of each other)含まれているドキュメンツを検索することができる。A AND BではAとBが同じページに含まれていればAとBの関係にかかわらず全てリストアップされてしまうが、NEARを用いることでAとBの関係が強いものに検索結果が絞られる。ひじょうに便利である。

(1) 演算子の使い方

(さくら銀行も三和銀行もない今となってはあまりいい例とは言えませんが)

sakura AND bank
sakuraとbankのいずれも(both)含まれているドキュメンツを検索する。

sakura OR sanwa
sakuraとsanwaの少なくとも一方が(at least one)含まれているトキュメンツを検索する。

sakura NEAR international
sakuraとinternationalがお互いに10語以内に(within ten words of each other)含まれているドキュメンツを検索する。たとえば、Sakura Finance Interntionalという語句を含むドキュメンツがあればヒットする。

sakura AND NOT tree
sakuraを含むドキュメンツからtreeを含むものを除いたドキュメンツを検索する。あるキーワードを検索する場合で、明らかに不要なものを予め除く場合に有効。sakura AND NOT treeは、 sakura AND(NOT tree)と同じ。 sakura NOT treeという使い方はAltaVistaでは文法的に誤りなので注意のこと。

(2) 括弧の使い方

慣れないと括弧の使い方は難しい。

gold OR silver AND platinum
gold OR (silver AND platinum)
(gold OR silver) AND platinum
最初の2つの検索は同じ意味をもつ。silverとplatinumの両方を含むドキュメンツ、またはgoldを含むドキュメンツを探す。もしも、platinumを必ず含み、さらにgoldまたはsilverのいずれかを含むドキュメンツを検索するのであれば、3番目を使う。
図に表すと次のようになる。

NOT gold AND silver
(NOT gold) AND silver
NOT (gold AND silver)
最初の2つは同じ意味をもつ。すなわち、silverを含みgoldを含まないドキュメンツが検索される。goldとsilverの両方を含むドキュメンツを除外する場合には3番目を使う。

gold NEAR silver AND platinum
(gold NEAR silver) AND platinum
(gold NEAR silver) AND (gold NEAR platinum)
最初の2つの検索は同じ意味をもつ。すなわち、goldとsilverとが互いに10語以内にあるドキュメンツで、かつplatinumを含むドキュメンツを探す。もしも、goldとsilverが互いに10語以内にあり、かつgoldとplatinumも互いに10語以内にあるドキュメンツを検索する場合には3番目を使う。

NOT gold NEAR silver
NOT (gold NEAR silver)
silver AND NOT (gold NEAR silver)
最初の2つの検索は同じ意味をもつ。すなわち、いずれも、silverとgoldが互いに10語以内にあるドキュメンツを排除する。もしも、silverを含むドキュメンツを検索するが、silverとgoldが互いに10語以内にあるものは除きたい場合には3番目を用いる。

gold NEAR silver OR platinum
(gold NEAR silver) OR platinum
この2つの検索は同じ意味をもつ。すなわち、goldとsilverが互いに10語以内にあるドキュメンツ、またはplatinumを含むドキュメンツを検索する。

gold NEAR (silver OR platinum)
(gold NEAR silver) OR (gold NEAR platinum)
この2つの検索は同じ意味をもつ。すなわち、goldとsilverが互いに10語以内にあるドキュメンツ、またはgoldとplatinumが互いに10語以内にあるドキュメンツを検索する。

(01/19/2002)

3.簡単な検索例

(以下は1997年1月に書いたものです)
昨年(1996年)のベストセラーであるグラハム・ハンコック「神々の指紋」について調べよう。今日テレビで特集をやっていて調べたくなったのだけれど、読んでもいないし本も持っていない。したがって、グラハム・ハンコックの正しいスペリングもわからないし、本の原題もわからない。
まずは、「指紋」だからキーワードを「fingerprint」としてSimple Queriesを行ってみた。ただし、単数形か複数形かも分からないので、ワイルドカードのアスタリスクを使って「fingerprint*」と入力した。
結果は、20000件のヒット。最初にリストアップされたページは刑事や医学に関わる「指紋」の話や、fingerprintというプログラミング用語でもあるのか、コンピュータのプログラミングに関するページばかりで、ほとんど役に立たず。
そこで、Advanced Queriesを使うことにし、とりあえず「fingerprint* near god*」と入力した。「神々の指紋」というからには、単数形か複数形かは分からないが、fingerprintとgodという語が近い場所にあるはず。
結果は300件のヒットと相当絞り込まれた。ここまで来ればもう近い。検索結果のトップには「23 Skidoo!」というページが次のように要約されている。

Documents 1-10 of about 300 matching the query, in no particular order.

23 Skidoo! THE EVER-EXPANDING LIST OF THE SYNCHRONOUS OCCURANCES OF THE NUMBER TWENTY-THREE (23) WITH APPLICATION TO THE LAW OF FIVES (2+3=5) This page was last...
http://www.impropaganda.com/~street/detour/23.html
- size 19K - 1 Dec 96

これでは何のことか全くわからないが、試しにアクセスしてみよう。何かヒントになるかもしれない。
かなり長いページで、どこにfingerprintやgodが出てくるのかすぐには分からないので、インターネットエクスプローラのメニュー「編集」⇒「このページの検索」を使い、ダイアログボックスに「fingerprint」と入力する。すると、すぐにfingerprintやgodを含む次の段落が表示された。

December 23, 2012A huge cycle ends in the Mayan calendar. Terence McKenna thinks the eschaton will immanetize. Other theories suggest the ice caps, having become wobbly from the gravitational pull exerted by the alignment of FIVE planets directly opposing the earth on 5/5/2005, will cause the crust of the earth to slip over the soggy innards, causing the ice caps to melt,and new ones to form. Of course, this will cause massive flooding, earthquakes, and general mayhem. All because the earth is slightly tilted, averaging about 23 degrees! (Refer to Graham Hancock's Fingerprints of the Gods for more background on this pheonomenon. It ties in the Egyptians and other ancient civilizations, Atlantis, Osiris, star-charts, geological evidence, and hard physical evidence of the remnants of a lost, technologically superior race.)

これで、正しい著者名も原題も分かった。後はどんどん絞り込めばよい。
Simple Queries"fingerprints of the gods"と入力。結果は102件のヒット。
同じくSimple Queries"Graham Hancock"と入力。結果は300件のヒット。
最後に、Advanced Queriesで 「"Graham Hancock" and "Fingerprints of the Gods"」と入力。結果は113件のヒット。
"fingerprints of the gods"で102件だったのに、何故、より厳しい条件の"Graham Hancock" and "Fingerprints of the Gods"で113件になるのか不思議かもしれないが、これはSimple QueriesとAdvanced Queriesとが異なったインターフェイスをもつことによる。
参考のために、検索結果の最初の10件は、次のようになった。因みにAltaVistaは検索結果を10件ずつまとめて表示する。

Documents 1-10 of 113 matching the query, in no particular order.
23 Skidoo!
THE EVER-EXPANDING LIST OF THE SYNCHRONOUS OCCURANCES OF THE NUMBER TWENTY-THREE (23) WITH APPLICATION TO THE LAW OF FIVES (2+3=5) This page was last...
http://www.impropaganda.com/~street/detour/23.html - size 19K - 1 Dec 96

Earth News - January 1996 - Issue 2
September 1995 - Issue 1. This Months Features. Shushhh! (Kicking up a fuss in your Library) - Trevor Spink. What's all this Internet Business?? - Trevor..
http://www.sreact.co.uk/earth/efnews/sept95/efnl01.htm - size 6K - 7 Mar 96

EXCLUSIVE REPORT * HOAGLAND'S DC PRESS CONFERENCE
Internet UFO Group Media Archive. From:Michael Carlin (migca@wco.wco.com) Title:EXCLUSIVE REPORT * HOAGLAND'S DC PRESS CONFERENCE. Source:CNI News....
http://www.schmitzware.com/IUFOG/News/827521339.html - size 6K - 22 Mar 96

Mysteries
ADVENTURE. MYSTERY MYSTERY MYSTERY MYSTERY ADVENTURE. ADVENTURE MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY MYSTERY...
http://www.mixteca.com/expeditions/22.html - size 9K - 18 Nov 96

Return to the Source
A symposium sponsored by the Society for Scientific Exploration and funded by a grant from the Lifebridge Foundation September 27-29, 1996 John M. Clayton.
http://www.jse.com/source.html - size 15K - 11 Sep 96

The Ark of the Covenant
The Ark of the Covenant. Festivals of the Arks. At the great temple of Luxor in Upper Egypt, carved in stone is "a permanent and richly illustrated...
http://marlowe.wimsey.com/~rshand/streams/scripts/ark.html - size 25K - 2 Oct 96

Abysmal Links
What A Fantastic Death Abyss!'s Musician(s) of the Month | Msico(s) del Mes Ceolt(ir/ora) de Mhí | M蚣adens Musiker. Winners..
http://www2.ucsc.edu/~dego/links.html - size 12K - 16 Nov 96

Close to the Heart..
Close to the Heart.. Earth Changes-ET's & The Haarp Project...Summary.. A letter from Dan Winter, to friends of Sacred Geometry, Crystal Hill, and the.
http://www.estrie.com/macphi/earthchg/earthchg.htm - size 34K - 23 Jul 96

Atlantis Rising Table Of Contents Issue #4
Issue Number 4. Table Of Contents. Articles. DEBUNKING THE DEBUNKERS by David Lewis If you believe in the paranormal, or life after death, you better...
http://www.aa.net/~mwm/atlantis/ar4contents.html - size 8K - 12 Jun 96

trailer
NHA Entertainment. Hot Summer Reads. Going on vacation? Finally going to get a chance to catch up on your leisure reading? Here are some recommendaions...
http://www.v2net.com/nha/NHStyle/Leisure/ByType/Entert/sumeread.shtml - size 5K - 1 Dec 96
(01/04/1997)
前のページに戻る 「検索エンジンの使い方」の目次に戻る