気むずかしい検索エンジン

Google

2004年7月10日

Yahoo と Google の提携が解消されてから Google 経由のお客さんがだいぶ減った。その代わり Yahoo 経由のお客さんは増えている。『いったいなぜだろう?』と毎日考えているうちに、いくつかの発見があった。

まず、予備知識として【Web マスターのための Google 情報】というページを一通り読んでもらいたい。その中の「ガイドライン」にアタシのコラムは抵触するかもしれないのだ。

デザインおよびコンテンツに関するガイドライン

「TITLE タグ」と ALT タグが、「正しく内容を説明している」ことを確認します。

品質に関するガイドライン - 推奨

コンテンツに「関係のない言葉」を含んだページを載せない。

どうもアタシの文章の場合、「カッコ」でくくった部分が Google の検索エンジンスパム対策に引っかかるらしい。1話が1ページで完結する場合は問題が生じにくいのだが、1話が複数ページになる場合、このガイドラインに抵触しやすいのである。

では、今回のケースを説明しよう。

  1. この話の題名は「A事件(Bをめぐる論争)」で、ページ数は5ページである。
  2. 起承転結、すべてを読めば納得のいく題名がつけられている。
  3. だが、「起」には事件の発端が書いてあるだけで、Aという単語もBという単語も出てこない。
  4. 「承」の部分でAが初登場する。
  5. さらに「転」でBという言葉が初登場する。
  6. そして「結」にオチがあり、読者は最後まで読んでから、はじめて題名に隠された深い意味を理解することになる。つまり、文学的には正しいのだ。
  7. なお、Aは人物だが、ある特定宗教団体の名前に似た「アダ名」になっている。

でだな・・・

この話は人間が読むとけっこう面白いはずなのに、Google に読ませるとなぜか「反則」扱いされて、いつまで経ってもリストに載せてもらえない。

そこで原因を考えてみた。

  1. 1ページ目からA、Bふたつの単語が出てくれば問題ないだろう。だが、話の構成上それはできない。だから「起」のページに META タグで説明を入れてあるのだが、Google は疑り深いため、META name="Description"(要約)を鵜呑みにしないのだ。だから Google は、関係のない単語を題名に入れたと誤解しているのだろう。
  2. ある特定宗教団体とは「統一教会」のことだが、この事件は「統一教会」とまったく関係がない。問題はおそらくココにあるのだが・・・この文章の場合、「統一教会」をキーワードとして意識していない。同音異義語(パロディー)として登場させているのだ。
  3. Aとは「統一協会オヤジ」というアタシが作ったアダ名(造語)である。「教会」と「協会」は似て非なるモノであり、アタシは反則を犯していないはずだ。ところが、 Google は「統一協会」と「統一教会」を同義語、あるいは「故意の誤字」と見なしている。
  4. しかも、この文章は1話目が完結したあとに続編を書いたため、1話目に「エピ騒動1」、2話目に「エピ騒動2」という STAR WARS のパロディーを組み入れてある。(まさに上へ下への大騒動なのだ)だから、人間が読めば非常に凝った面白い題名になっているのだが、Google はその芸術性を無視して「内容に関係ないから反則」と決めつけるのである。

これらをふまえて読んでほしい。

統一協会オヤジ事件 エピ騒動1(SI 単位をめぐる論争)

統一協会オヤジ事件 エピ騒動2(マクドナルド編)

読めば、ここに登場するオヤジが「統一協会オヤジ」と呼ぶにふさわしい人物であることがわかってもらえるだろう。SI 単位の普及に熱心なあまり、周りがまったく見えないジコチューなのだ。

今後どうするか。

もうしばらく様子を見てもこの文章が Google にリストアップされない場合、アタシは Google に質問状を送ってみるつもりだ。なぜなら、Google があまりにも文学的な手法を無視した杓子定規なアルゴリズムを採用しているからである。

確かに検索エンジンをだまして不当に検索順位を上げようとする人間は多い。だが、それらを排除するために正当な文学的手法が無視されたら、文系の人間はどうやって話の結末を最後まで見せないようにできる?

もちろんパロディーも受け入れてもらいにくい。Google は「故意の誤字」とパロディーの区別ができないのだ。それじゃ困るんだよ。せっかく風刺の効いた面白い文章を書いても Google がそれをリストアップしてくれないんじゃ、大きな入口のうちのひとつを失ってしまう。

論文みたいな文章はイイのさ。最初に SUMMARY(要約)を見えるところに書くからね。だけど、最後まで読んだとき、初めて題名の意味がわかるような文章が受け入れられないってのは、文系の人間を困らせるんだよ。そんなアルゴリズムを入れるんだったら META name="Description"(要約)を内容として読んでもらわなきゃ話にならない。

Google は疑り深いから、META タグで要約を書いても信用しないんだ。本文に書いてある内容しか信用しないんだよ。だから題名が抽象的(文学的)だったり、造語(パロディー)だったりすると、内容と題名の一致を見出せない。そのくせ題名を最重要視するから、内容と題名に含まれるキーワードが一致しないとリストに載せなかったりするんだな。

言ってる意味がわかるかな?

まず、META タグが何だかわからないと話が見えないだろう。META タグというのは、表のページでは見えないんだ。ソースに書いてあるんだよ。ソースと言ってもブルドックソースみたいなソースじゃない。ブラウザによって違うが、「ソースを見る」とか「ページソース」ってところを押すと見られる HTML(記述言語)のことだ。そこに META というタグでキーワードを書いたり、あらすじを書いたりできるわけ。

ところが、表のページでそこが見えないのをいいことに、内容に関係ない人気キーワードを META タグでたくさん書き込むヤツがいる。だから Google は META タグで書いてある「キーワード」や「あらすじ」を(ほとんど?)無視して本文だけ拾っていくようにロボット(クローラー)をコントロールしているのだ。

でだな・・・

アタシのコラムが Google のリストから大量に消えた理由は『それだ!』と思うんだよ。アタシのコラムは結末の数行で一気に落とす星新一のショートショート型が多い。しかも、題名が凝った造語になっていることも多い。文学的には正しいのだが、Google は「題名と内容が一致しない」と取っているんだね。

その「検索エンジンスパムを排除するためのアルゴリズム」が Yahoo との提携解消後に厳格になった。以前はもっと緩かったと思う。逆に Yahoo の新検索エンジンは META タグで書かれた要約に理解を示してくれる。要約に題名中のキーワードがあれば、本文にキーワードがなくてもOKなんだ。だから、Yahoo と Google は、かなり性格の違う検索エンジンになったと言えよう。

上の文章の場合、「統一協会 + 事件」と入力したとき、Yahoo は META タグで書かれた要約部分から文章を抜き出した。つまり、Yahoo は性善説、Google は性悪説を元にリスティングしてるってことだろう。どうも「統一協会」という言葉を「故意の誤字」として認識しているフシがある。

確かにこの問題はさじ加減がムズカシイ。厳格に「題名と内容の一致」でページをを吟味した方がイイ場合もあるだろう。だが、提携解消後の Google がはじき出す検索結果は、以前より面白味を欠くようになり、Yahoo と Google の違いがだんだん際立ってきた。

Yahoo は悪人にややだまされやすいが、大らかで冗談や文学的手法も通じる「人間味のある検索エンジン」。一方の Google は厳格な検索エンジンスパム対策が裏目に出て、猜疑心が強くて気むずかしい「杓子定規な検索エンジン」になったようだ。まるでJの国の入管みたいな・・・

もしこの両者が人間だった場合、アナタはどちらと付き合いたい? 当然 Yahoo の方だよね。でも、どちらとも仲良くしたい人はどうすりゃいいのかな? 論文みたいな文章なら、どちらでもいいんだけどさ。

アタシは「Google のアルゴリズムを決めている人よ、もう少し頭を柔らかくしなさい」と言いたいね。おかしな検索結果が出て喜ぶ人間だっているんだ。スパムとの見分けがつきにくいなら順位は下げてもイイさ。上位に入らないようにセットすればいい。でも、リスティングぐらいして欲しいんだよな。ペナルティーが厳しすぎるんだよ。アンタら、パロディーや風刺を否定する気か? そんなことすると文科・芸術系に嫌われるぞ。

最後に

この文章を読んだ友達がこんなことを教えてくれた。

ヤフーの Google に対する紹介文は「入力した語句を含むページだけを検索」

『ホントかよ?』と思って Yahoo Japan で「Google」と入力してみると・・・。皆さんもやってみて。提携解消後は商売敵になった両者だからね、これは痛烈な批判だろう。確かに今はそうなってるから「言い得て妙」だよ。

SEOを超えたホームページ集客術 プロが教えるSEM(検索エンジンマーケティング)

SEOを超えたホームページ集客術
プロが教えるSEM(検索エンジンマーケティング)