Main Index     Magazine Main    Erena Main    Physics Main    Etc. etc.    Mail .

SEO手法

検索順位は気になるけれど・・・

平凡な個人WebにおけるSEO手法の生かし方

 ここ1年ほどで、雨後のタケノコのように増えたSEO情報ですが、普通のサイトの 普通のWebmasterがどのくらいの知識と手入れをしているか?って伝わってこないと思う んです。
 そこで、自分の勉強したSEOについてのメモ書きを、ほとんどそのまま、レイアウトと “てにをは”を整えたくらいですが、公開してみます。
 まあ、プロの方には、いいかげんな甘いSEOの実情が見えて「反面生徒」の資料としても 役に立つんではないでしょうか!(苦笑)
 そんなわけで、厳密性や、勉強の資料としては、はなはだ不満足なものですが、一般の人間も、 そこそこやってるんだ・・・って姿が少しでも伝われば本望です。

第0章 検索したい・検索されたいの〜


【0-1】最初はGoogle!

 私たちが、WEB上の「見たいページ」に行き着く方法には、リンク集・紹介記事・悪のお誘い?・・・等いろいろありますが、現在では70〜80%程度の人が、あるデータに到達するために Google(グーグル)などのサーチエンジンを利用していると言われています。
 たぶん、これをお読みいただいておられるあなた様も、最初は、サーチエンジンで、このサイトに「漂着」されたことと推量いたします。
 私は、Googleを検索だけでなく、よく行くサイトの「 リンク集≒URL電話帳 」代わりにすら使っていますが、このような日々の利用においても、Googleの安定性は群を抜くものがあります。
 以前、Googleのランキング手法変更で、訴訟に発展した件が米国にありましたが、すでにある種の会社の命運を左右するまでに検索エンジンの存在は大きいものになっています。
 ウチのように極端に偏った情報を掲載しているサイトは、Googleに表示される順序が、多少上下しても、大勢に影響ないんですが、それでも、gooで何番、Googleで上位・・・なんてのは、自己顕示欲を満足させてくれます。
 たとえば Googleで、ここが何番目ぐらいに表示されるか?今(2003年 6月23日)試してみると。
「英玲奈」というKWで検索すると、1番
また、
「アイドル雑誌」という単語で検索すると・・・5〜6番目
そして
「量子力学」で検索すると、1〜2番目
といった現状です。(それぞれ検索されるファイルは異なりますが)。
 この3つの「キーワード(KW)」に力を入れて、このサイトを作っているので、このようにソコソコ、上位に検索されますと、とてもウレシイですし、励みになります。

【0-2】SEOが盛んになって

 さて、サーチエンジンに検索されやすくする(=検索結果の上位に表示されたい)・・・という手法の研究は、その重要性を考えると、ある種「自然発生的に生じたこと」と想像されます。
 私のようにあまり必要でなかった人間ですら、「SEO」という概念を知るはるか以前!から
「gooの検索結果に出てくる、”説明文”を、どうにかして適切な文章にできないか?」
「Googleで表示される代表ページを、一番見せたいファイルにわりあてられないか?」
・・・・なんてことを、自分ひとりで、ずっと考えていましたから。
 で、話題とすべき「SEO」とは、私たちのページをサーチエンジンがデータベース化する時に、重要なキーワード(KW)が検索されやすいように吟味選択し、KWとそのページの関連が深いと判断してくれるように、Webの記述表現(特に「HTMLファイル」の内容表現)を工夫し、更に加えて、そのページの重要性を、サーチエンジンが認識してくれるように、他のサイトからのリンク状況などを充実することで、
SEO="Search Engine Optimization"

の略です。
 なお、2003年現在、多くのWeb検索システムが独自路線を放棄し、Googleよりデータ提供を受けるようになってきていますので、
SEO≒GEO?
(for Google Engine Optimization ??)

と化している感じがいたします。そのあたりの事情を踏まえて、お考えいただければ幸いです。
 
 以下では、私が2年ほど、Webデータや、雑誌記事などより集めた情報を、羅列させていただき、少しだけ経験談を加えたものを記録したいと思います。多少HTMLのタグなどの知識が必要な文章になりますが、詳しい事がわからなくても意味がとれるようにしてみますので、よろしくお願いいたします。
 なお、検索エンジンもバカではありませんので、姑息な手段を用いますと、後述するような「SPAM行為」とみなされ、検索対象からはずされてしまう・・・という悲しい目にあうことになります。したがいまして、大前提として、「コンテンツが充実して、ファイル分量もある優秀なサイトであること」という条件があって、はじめて、評価に加えられるはずだ!・・・ということには、充分気をつけていてください。

第1章 検索順位はなんで決まる?


 検索エンジンが、リンクをたどって、Webページをみつけ、キーワード(KW)検索のデータを採集する様子は、漠然とイメージできると思いますが、表示順位がどのように決まるのか?はよくわからないものです。
 最初私もよくわかりませんで、「goo」ができたころ、検索結果に点数がついてランキングされているの見て、「どうやって、日本語文章を採点してるんだろう〜?。一つ一つ誰かが読んでるのかな〜?、それともプロバイダがアクセスの回数をカウントしてるのかな〜??」なんて的外れなことを想像していました。
 ここでは、「検索ランキング決定」について言われている、常識的なSEO部分をまとめてみました。

【1-1】内部要因〜キーワードの充実度

 まず、どんな単語が取り上げられて、キーワードとして重視されるか?という評価の基準について知ることからはじめます。

1-1-1 キーワードの頻度と数が当然大切

 「アイドル」をとりあげたページなら、当然「アイドル」というキーワードが、文章中にたくさんあるはずです。
 そこで、検索キーワードの「割合」(総数も効きますが、むしろテキスト全体に対する%)に注目して点数がつきます。この割合については、一説には全単語の3〜5%程度が、注目キーワードであるように調整するのがよいそうです。
 この時に気をつけるべきことは、たとえば女優の英玲奈(えれな)さんを検索するときに、「英玲奈」「えれな」「エレナ」「ELENA」「ERANA」・・・は別単語かどうか?ということです。一般的には別単語とみなすべきですが、すべての検索されたい単語それぞれを5%ずつ書き込むと、内容が収拾できないような大変なことになってしまいそうです。
 人間の心理や、辞書FEPの傾向を想像し、最適なつづり方のキーワードをいくつかに絞る必要がでてくるわけです。他の異字表記はあきれめて、1・2回くらいの出現に調整することが多いと思います。
 また、「英玲奈」は、キーワードにされるとき「英」と「玲奈」にわけられてしまうことがあります。要素分析手法上、どうしょうもありませんが、「英」と「玲奈」が離れているよりは、密接してあるほうが「英玲奈」と検索したときの評価は高いようです。同様に「東京都インターチェンジ(ひがしきょうと・インターチェンジ)」は意に反して「東京都」と「インターチェンジ」に分けられてしまう可能性が高いでしょう。
 これらを避けるにはいろいろな工夫が必要になります。「京都」の分離性を強く反映させたいのでしたら「東(ひがし)京都インターチェンジ」という表記を少しまぜたり、「東」だけを色違いにしてみたりするのも、効果があるかもしれません。(未確認)。

1-1-2 title内のキーワードは一番重要

 ここでいうタイトルは、HTMLファイルの「head」部内で
< title > タイトル </title >

と表記されている部分のことです。
 タイトル名を抽象的だったり芸術的につける場合もあるでしょうが、「アイドル雑誌」という単語が入ったタイトルのページでしたら、高い確率で「アイドル雑誌」についての内容が書いてあることでしょう。ですから、タイトルに記されたキーワードは、とても高い点数がつきます。
 また、「私の好きなアイドルの雑誌たち」などといった奇麗な修飾をするより、「アイドル雑誌・水着グラビア」などと言った「ズバリな名前」をつけた方が、かなり効果的なようです。
 深い根拠もない、だいたいの経験上の雰囲気ですが、評価の1/3くらいは、このタイトルのつけ方で決まるように感じています。
 わたしは、タイトルをズバリにしたいけど、それだけ・・・っていうほど割り切れる根性もないんで
 
 「アイドル雑誌+ファッションモデル英玲奈さん=オヤオヤ文庫」
 
なんてゆ〜、緩い表記をしています。でも、最初が「アイドル雑誌」という単語の方が、かなり効果的なようです。
 ちなみに、 < title > タイトル </title > は行変えせず(リターンをせず)一行で書くのが良いという記述がありますし、たしかにおかしな振る舞いをする場合があるんで、そうした方がよいのでしょう。

1-1-3 キーワードの位置と装飾で重みが評価される

 段落を強調するために、
<h1> アイドル雑誌収集法 </h1> 

のように見出しをつけることをよくします。そして、その見出しは、たぶんそのあとの内容を簡略に示していることでしょう。また、「段落・文章」のはじまりには、全体を概覧するような総合的単語があることでしょう。
 そのような場所に書かれた単語は、重要度が高いとみなされ、点数が高くなります。
 また大事な単語は、タグで色をつけたり、大きさを変えたり、太くしたりすることでしょう。そこで装飾のあるキーワードは評点が高くなります。
 このようにキーワードの現れた場所や、強調の度合いによって、評点は変化します。
 概略 以下のような順番でキーワードをちりばめる工夫をすると良いようです。
1)見出 <h数>〜〜〜 </h数>(数 = 1,2,3,4,・・・) 内にキーワードを含ませる。できれば先頭語がキーワードであるほうがよい。
2)文や段落のできるだけ先頭部に、重点的にキーワードを配置する。
3)キーワードを、太さ<strong>、斜字体<em>、文字サイズ・色づけ<font>、位置設定などの修飾用のタグで強調する

1-1-4 補助説明文を充実する

 表組を作成するタグ<table>の”SUMMARY=”や、画像を表示する<a herf>の中の”ALT=”などという補助説明の記法があることをご存じかと思います。これを用いると、その表や写真が何なのか?をコンピュータに知らせるための、補助的な説明文を書くことができます。
 その「説明文」にかいてあることは、たぶん重要な表や画像の内容を簡潔に説明していることでしょうから、通常の部分の単語より重要視されます。ですから、説明文に「写真1」と書くよりは、「英玲奈さんの美しい舞台」と書いた方がはるかに効果的だと言えます。
 現在の技術では、検索エンジンは、画像が何の写真なのか?理解することはできません。(将来は、画像理解まで行くとは思いますが・・・)。ですから、図や画像、リンクなどの説明は、長すぎない程度に丁寧に、かつキーワードを含めるようにするのが良いのでしょう。
 
 【補足】なお、2003年から、画像のALT説明文は、SPAM行為的利用が多いため(?)、リンクに使われる画像を除いて、Googleでは検索対象に使われなくなりました。

【1-2】リンク元の重要性

 そのサイトに書いてあるデータが、本当に優れているものかどうか?を、検索エンジンは自動判別することはできません。ウソのデータを、ちょっと見ただけではわからないような感じでしっかり記述をしていたら、今の技術で、サイトの良否を自動判定する事が不可能なのは明らかでしょう。一つ一つのページを人間が見て評価できるのなら良いのですが、今となっては量的にありえないことです。
 そこで、WEB上に満ちている人為的評価である「リンク」を重要視することになってきました。
 この、“リンクの面からみたそのページの重要度(評価)”を「リンク ポピュラリティー」と言います。
 多くのサイトからリンクされているところは、いいサイトだ!・・・
という「公理的」判断がそこにはあります。たしかに、わたしも、「変なサイト」「サギ的なサイト」にはけっしてリンクを貼りませんから、それはだいたい正しいんだと思います。

1-2-1 リンクの採点基準

 リンクによる判断基準は概略以下のように言われています。
 
 1)多くのサイトからリンクされているか?の『量的問題
 2)優れた(評点の高い)サイトからリンクされているか?の『質的問題
 3)同系統のサイトからリンクされているか?の『ジャンルの問題
 
この3つが、総合的に評価されるようです。
 
 1)の『量的問題』は自明だと思いますんで省略します。後述しますような良いサイトからたくさんリンクされるように心懸けることが重要です。
 
 2)の『質的問題』は、ある種のトートロジー的問題を含んでいますよね?。
「いいサイトは、いいサイトからのリンクが多い」
「いいサイトからのリンクが多いのが、いいサイト」
という、構造です。
 人気のあるサイトから人気のあるサイトへのリンクというのは、まさしくクモの巣(Web!!) のように、行き帰りしながら網羅されているのですから、この結合性の重み評価には、数学的・トポロジカルな定量解析が少し必要になります(私の貧しい頭では理解できるはずもないので、省かせてください)。
 
 YAHOOなどの大規模・有名なディレクトリ型検索に登録することも、多少効果があります。・・・というより、最近は、検索ディレクトリやリンク集の主な存在目的は、ロボット検索への「リンク・ポピュラリティ」判断材料を供給することだとさえ言える気がします。
 
 3)の『ジャンルの問題』は、そのサイトのテーマの解析を、たとえばディレクトリー検索のような分類分けにそって行い、いくつかの属性をそのサイトに与えることのようです。これには、“同系統のサイトからリンクされるサイトほど、いいサイトだ”という考え方がベースにあります。したがって、あまり極端に違うジャンルの内容を一つのサイトにちりばめるのはSEO上、効率的でないと言えるでしょう。
 しかし、私のところのように、「物理」と「アイドル」という異なるジャンルが同居しても、検索が壊滅していないところをみますと、ジャンルが異なるコンテンツが同居することが、致命的で問題外である、というわけでもなさそうです。(^^;)

1-2-2 最低リンク数

 ちょっと困った問題に、「Googleでは、他のサイトからリンクされていないサイトは、検索対象に加えてもらえない」というのがあります。
 これって、知らないと困りますよね。私はてっきり、「Google」のホームページにある、「サイトの登録」のところに、URLをかき込めば、あとはどうにかなるんだ!と思ってました。
 ところが実は、一生懸命HTMLを書き込んで、「さあ公開!」ってやっても、だれかソコソコ優秀なサイトの親切なマスターさんがリンクしてくれないと、永遠に検索してくれない!ってわけです。  つまりリンクをもらう作業をなにもしないと、「絶海の無人島に、椰子の実が流れ着くのを待つ!」ような状態になってしまいます。性善説を信じれば、いいサイトならきっといつかは、誰かに見つけ出されるものなのかもしれませんが、そう悠長なことを言ってられませんから・・・なにかしらのリンクしてくれそうなサイトを探すことになります。
 デジタル万能のように思われるWebの世界に、リンクのつながりという「人づきあい」の要素が発現する・・・わずらわしい気もしますがチョット救われる雰囲気もあります。
 インターネットと言えども、しょせん人が作り出した道具、手足五感の延長にすぎないということを感じてしまいます。

第2章 HTML準拠の重要性


【2-1】収集ソフトは正確なHTMLを要求する

 ネット上のファイルの内容を獲得するために、検索エンジンも、ファイルの中身を「見て」知るわけですから、彼らも、インタネット・エクスプローラ(IE)などと同じ、ある種ブラウジングソフトの性格を持っているわけです。
 ですから、捜しだしてもらった自分のファイルから、検索エンジンにキーワード等を抽出してもらうためには、HTMLの文法をできるだけ正確に守っておく必要があるわけです。
 以前は悪名高かったマイクロソフト社のIEですが、ホームページ制作ソフトも買えず、ファイルを手書きしてコンテンツを作っている私には、「IEはよくできてているな!」、と実感することがあります。文法エラーに強く、たとえばタグをとじ忘れたりしても、しっかり表示してくれます。古い時代のブラウザなら、真っ白に表示してしまうような、重要なエラーであっても、今のIEはなんとかしてくれることが多いようです。
 しかし、検索エンジンは、かなり律儀に文法を追っていきますので、場合によっては文法エラーは致命的です。

【2-2】しっかりとした、標準形式のリンクを記述する

 ネットにおけるリンクの重要性は、Googleのリンク重視を持ち出すまでもなく自明のことでしょう。
 わたしのサイトのあるページに検索エンジンが到達したとしても、次にどこに行くか?わからなければ、わたしのサイトの他のページの内容を、読者も検索エンジンも見たり、収集したりできるはずがありません。収集してもらわなければ、検索にひっかからないのです。
 
 私たちは、「自分のサイトのスミからスミまで、検索エンジンに見てもらいたい」のですから、すみからすみまでつながった、「検索エンジンにわかりやすい」リンクを記述する必要があるのです。
 
 そして、検索エンジンが“HTMLのみ”しか、現状では正確に理解できないということを、良く心得ておくべきです。
 FLASHや画像、動画など、HTLM以外による表現は理解できません。つまり、FLASH上にあるリンクは、検索エンジンはたどることができなのです。同様に複雑なJavaScript使用のリンクも理解できない場合が多いようです。
 このあたりは徐々に改善が進み、比較的近い将来、FLASHのリンクも理解できるようになることは、間違いないでしょうが、今、この時点で、SEOという目では、FLASHを選択するメリットはないようです。
 同様にCGIによる動的HTML生成も、容認しない検索エンジンも多いようです。拡張子が「.cgi」であるようなページを全く検索出力しないシステムがかなりあります。
 ですから、CGI形式のリンクページも、リンクポピュラリティの向上には、役に立たない場合が多いようです。
 現状を認めた上でのリンク書式の問題ですが、やはり
 
 テキストリンク
<A href="http://〜" title="丁寧な説明"> 簡単なリンク名</A>
 
 イメージリンク
<A href="http〜" title="丁寧な説明"><IMG ALT="丁寧な説明" src ="画像ファイルurl" title= 丁寧な説明"></A>
 
がよいように思えます。とくに後者は「丁寧な説明」を3回も設定できるので、リンク元/リンク先のテーマ関連付けを強調する効果があるかもしれません(未確認)

【2-3】フレーム使うなら、しっかりと <noflame>を書く

 またflame構造も、SEO上かなり問題のようです。
 複雑なフレーム構造をつかって表記されたフレーム内部のファイルは、検索対象になりにくい、と言われています。
 実は、私の“量子力学のページ”は、「左に目次」「右に本文」ていう、とてもシンプルなフレーム構造をずっと採用してきたものですから、「フレーム構造がSEO上好ましくない」と言われて、ちょっとショックだったんです。この構造って、歴史年表のようなものを表示するのには、確かに合理的でしたから。
 ただ、まったく検索が及ばないわけではないのは確かで、わたしの量子力学のページは「フレーム構造ファイル自体」がGooleでの「量子力学」という検索で1位になったこともあります。
 一応、フレーム構造のファイルには、フレーム構造が理解できないブラウザのためのしくみである、”<noflame>”表記内にしっかりと、概要やフレーム内に実際に表示されるファイルへのリンクをかき込んでいます。
 <noflame>内に書く内容としては、よく古いHTML入門書にある「あなたの環境はフレーム構造に対応していないようです云々・・・」というのは、とてももったいないことデス。<noflame>表記内にある文章は、「検索エンジンに見せるべき内容」と割り切ってしまってもいいと思います。違法とみなされない範囲で、そのページの内容・キーワードやリンクを表記して、検索エンジン対策としています。

第3章 常識外のこと


 SEOをやっていると、従来思っていたことと、まるで異なる「悟り」に達することがありました。
 そのあたりにちょっと触れたいと思います。

【3-1】サイトマップは、工夫しだいで面白い

 そのむかし「サイトマップなんてのは、どへたな作者が作った、ページ構成やレイアウトが直観的でないサイトに、仕方なく作るもんだゼイ!」なんてセリフを言われて、実はずっとそのまま鵜呑みにしてきました。
 
 でも、SEOをやっていて、ハタと「サイトマップの効果的利用法」に気づいたんです。
 
 「・検索エンジンに、サイトにある全てのファイルの存在場所を教えられて
  ・キーワードやファイルのテーマをしっかりかき込めて
  ・キーワード表記のバリエーションが、視覚効果を気にせず、自由に味つけできて
  ・ファイルの階層構造もしっかり整理して表示できる
  のは、サイトマップじゃないか!」
 
ってことです。
 
 色々な、“しがらみ”の中で、つい深くなってしまった階層のファイルや、フレーム構造に埋もれてしまっているファイルなどを、明示的に検索エンジンに教えてやっても、サイト構成上、全く違和感のないのがサイトマップです。そして、どんなレイアウトや書式にしても、サイトの流れを乱さないのもいいどころです。
 読者への配慮を意識しながら、キーワードや強調の仕方などを工夫すると、SEO面でも楽しくて効果的だと思います。

【3-2】HEAD内表記は、ほとんど不要、害もある

 HTMLファイルのHEAD部には、そのHTMLの概要などをブラウザに伝えるためいくつかの情報が含まれています。
その代表的なものが<meta>タグによるキーワード・内容表記です。
 
ありがちな<META>表記の内容例は、こんな感じでしょうか?
 
<META content="text/html; charset=Shift_JIS" http-equiv=Content-type >
<TITLE>オヤオヤ文庫伝言板</TITLE>
<META content=雑誌に掲載されたアイドル記事をまとめたデータ集。 name=description>
<META content=英玲奈,アイドル雑誌, name=Keywords>
<META content=英玲奈ちゃん応援,量子力学年表,アイドル雑誌記事 name=Index>
<LINK href="mailto:×××@○○○.co.jp" rev=MADE>
<LINK href="sitemap.htm" rel=NEXT>
<META content="HTML 7.01.1234.5678" name=GENERATOR>
 
 キーワード、や、内容説明など、いかにも検索むけの表記が用意されていますが、残念ながら、ほとんどの検索エンジンでは、利用されないか、利用されてもベタ本文程度の重さしか持ちません。
 重要視されない理由は、ここの表記内容に対する、個々の制作者の力の入れ方に違いがありすぎることと、場合によってはウソの表記でエンジンをだますために使われたりしたことが(歴史的に)あったためと思われます。
 最低限必要な、charsetと、scriptの有無などを除けば、SEOの立場からは無意味な感じです。gooが「description」を使ってくれることがあるくらいなもんです。
 実はHEAD部が長いと、BODY(本文部)が出てくるのが遅くなるため、せっかくBODY先頭に設定したキーワードの重要度が相対的に低下して、点数が落ちる傾向があるそうです。
 したがって、<META>による内容は必要最小限にし、HTML制作用のソフトがつける認識用の部分などは、「良心がゆるせば (^^;) 」削除した方がよいでしょう。
 また、HEAD部にjavascriptや、スタイルシート設定を長々と書く例がありますが、HEAD部に本当に必要なものだけとし、別ファイルにしたり、HEAD部以外に表記するなどの工夫が必要でしょう。
 遊び風につける装飾のためのscriptなどは、indexなど重要なSEO対象のページではやらずに、落書き帳などのページで試すのがよいと思います。
 
 実は私は、FLASHやVscriptはもちろん、JavaScriptも嫌いです。それらのソフトを書くこと自体は好きなのですが、人の作ったページにある無用冗長なFLASHコンテンツなどは好きになれません。自分のページでも、項目選択などHTMLときりはなせないJavaScriptを除き、遊び以外で使うことはやめました。
 最初はもの珍しかった「流れるメッセージ」や「マウスの動きにリンクする動作」も、もはやウザイだけですし、リンクページの表示を、JavaScriptで表記するのも、エラーになりやすく、ユーザビリティが悪いだけのものにしか、私には思えません。
 現状の検索エンジンの仕様であるかぎり、冗長なスクリプトはSEO上好ましくありません。将来、美しさやユーザビリティが、客観的に判定できるようになれば、これらの技術が生きてくることもあるとは思いますが・・・今はムダなだけです。

第4章 裏技はほとんど通用しないこと


【4-1】つい考えてしまうズルイSEO対策


 ここまで読むと、サイトのポジションを上げるために色々こそくな裏技を思いついてしまいますよね?
 
内容、キーワードについては
●本文にキーワードを無意味に、ものすごくたくさん書いたら・・・?
●タイトルに客寄せキーワードを沢山書いたら??
●見出しばかりたくさん増やしたら??
●見えない色の隠し文字や、ALT文字列などに、キーワードをたくさん埋め込んだら?
●全文を強調文字ばかりにしたら??
●表示されない文字で本文以上に、たくさんたくさんキーワードを書き込んだら?
●表面にでてこない「FLAME構造の中」にたくさんの検索用文字列をかき込んだら?
 
リンクポピュラリティについては
●必要もないホームページをたくさんたちあげて、リンクしまくったら?
●そこら中のリンク専門ページに登録しまくったら?
●ほとんど同じ「ミラーサイト」を立ち上げて、相互にリンクしまくったり、外からリンクさせたり、YAHOOに複数登録したりしたらどうか?
 
作法としては
●その客寄せページにきたら、すぐに、他の本当に見せたいページへジャンプするようにタイマー設定した。
●サイトが置いてあるサーバに、来訪したブラウザを判別させて、“検索エンジンが見にきた場合には、おいしげな内容”を返し、”IEの場合にはサギ的なページを表示”するようにさせた。

など、すぐ考えつきますし、実際、過去には効いた裏技もあるようです。
 
 しかし、長年の「悪意あるページ制作者」たちとの対抗の経験から、現在では、検索エンジンは改造され、これらの姑息な手段は、すべて効果がなく、評価の減点の対象になっています。減点の量刑も、「採点しない」「検索ランクを最低にする」「検索対象からはずす」など、その悪意によってレベルがあります。

【4-2】スパムとみなされないようにSEO


 このような「悪意をもって、検索エンジンの評価結果を左右しようとする行為」のことを「(検索エンジンへの)スパム行為」と呼んでいるそうです。(こう呼ぶのは、かの伝説的喜劇"モンティパイソン"の中の、ある回の話に因むそうですが、まあ、ハドロン構成要素を“クォーク”と呼ぶのと同様『かけはなれた用語による完全記号化』の類なので、語源にこだわる必要はないようです。)
 
 そして、注意しなくてはならない事は、善意でやった装飾やリンクが、スパムにとられる場合もありうるということです。
 
 このことでは、苦い想い出があります。「goo」ができた頃、<META content〜 が不十分だと、ファイルの先頭文しか検索結果にダイジェストしてくれないので、くだらない挨拶文しか表示されないことが多かったんです。そこで私は、自分の主なページの先頭に、背景と同色小文字でアブストラクト文を書きこんでおいたんです。もちろんレイアウトを崩さず、しかも読者・検索者の利便性のためでした。今だったらそんなバカなことはしませんが、SEOやスパムなんて言葉を知らぬ(そんな言葉無かったかもしれない?!)時代でしたから、あっというまに、検索順位は最後尾にまわされてしまいました。どんなに内容を充実させても最下位な事が、しばらく不思議でしかたがありませんでした・・・。背景と同色の文字が「いけない事!」である事に気づくまで1年、改善してトップになるのは、gooがエンジンを変えるまで待たねばなりませんでした。
 
 Googleなどは、かなり「善意」に解釈してくれるようにチューンナップされているようですが、色々な工夫の中で、たまたま「文字と背景の色が似てしまう」場合もありえますよね?
 また、サーバーをいろいろ渡り歩いているあいだに、そっくりなサイトや、同じサイトなのにエイリアス的なurlを持っているようなもの、または、同じ内容で、タイトルやキーワードがちょっとだけ違うもの・・・なんていうのを、いくつも作ってしまう場合もあります。これらも、悪意に解釈されればスパムになりえます。
 
 で、どうしたら、安全なSEOができるか?といいますと・・・いまのところ、検索エンジンの「善意」を信じて、くれぐれも注意するしかないようです。
 
 正直言いますと、いろんな資料を読んだり、聞いたりしても、Googleがどこまでを違反としているのか?よくわかりません。アイドルの名前だけが延々と、ただただ、たくさん小さくかいてあるだけのサイトに行っちゃったことってありませんか?(ウチのことではありませんョ!念のため!)
 これなんて、絶対にいわゆる「スパム」行為だと思うんですが・・・どうしてヒットするんでしょうね??
 ですから、こんなあやふやな状況の中で、「SEO」と「スパム」は紙一重!っていうリスクを個人責任で楽しめる人でなければ、あまり強引な「SEO」行為はやっちゃいけないわけです。

第5章 最近の補足


【5-1】Googleの近況


 Googleのデータ運用施設が、世界のどこに何ヶ所あるのか?というのは、今やミサイル基地がどこにあるのか!ということよりも重要な話になってしまいましたが、10箇所程度という記述が多いようです。その施設ごとに3個〜10個程度のコンパチなサーバーユニットを運用して、安全性を保っているようです。そしてこのおよそ100台弱のユニットが、いくつかのサーバーソフトを連携させて、情報収集から、蓄積、検索、営業を行っているわけですね(数字は全て推定です)
 最近の、Googleのサバーユニットは、80GB×2機のハードディスクをもつパソコン80台からなる装置4機より構成されているそうですから(インターフェース誌2004年1月号より)
80G×80×2×4=51.2TB が現状、Googleが処理しているデータ量に近いと言えるでしょう。このユニットがインデックスしているURL数は5G程度でしょうから、1URLあたりのバイト数は(世界平均で!)10kB程度というなんとなく納得できる数値になります(笑)。
 
 Googleも日々進歩し続けていて、2003年の改造では以下のようなものがあったそうです。
 1)巡回周期の複数対応
  早いサイトにも対応するため、従来の月1程度巡回のロボットに加えて、日々巡回検索を行うロボットが強化された。これに応じて更新がはやく、ランキングが高いものほど、早く更新される傾向になった。
 
 2)動的ページ・CGIページの採集強化
  今まで、あまり検索しても表示してもらえなかった動的に生成されるページも、単純でバリエーションの少ないものは、採集されるようになった。
 
 3)JavaScriptリンクの採集強化
  いままで弱かったJavaScriptのリンクも、単純なものは読み込まれるようになった。
 
 4)SPAM対策の強化
  単純画像のALT文内を、検索対象からはずすなど、標準的にやられてきたSEO行為を無効にする改革が行われつつあります。
 最終的には、構文解析の進歩に同期して、本文キーワードのみの重視に向かってしまうのかもしれませんね!。
 
 5)「リンク ポピュラリティー」重視傾向に翳り。
  いくつかの情報を見聞きしますと、“Googleの華”であったリンク重視傾向が、やや減衰傾向にある由・・・があります。もしこれが正しいとしますと、Googleがキーワード・構文解析に更なる自信を深めたことを意味するように思えます。これは、「私たちは、益々、コンテンツの充実自体で勝負せざるをえない!」という当たり前のことを意味するようですね!?

【5-2】履歴とリンク


2002年12月29日 初稿
2003年07月01日 4章改訂、一部誤字等修正
2004年02月04日 5章追加、誤植を修正
2004年04月25日 @nif用に校正


自設置カウンタ【utl_index】
count from May 01st ,2004 
アイドル・ファッション、エレナ、物理学のDATA BASE SITE ファッション雑誌やアイドル雑誌集 素敵な英玲奈さんはファッション雑誌などを中心に活動しています 量子力学の歴史を中心にした物理・年表、データ集です 雑多なSEO、アイドル、エッセイなどを書いてあります OYAOYA文庫へmail