BingはGoogleの結果をコピーしている? 検索エンジン探偵ストーリー

Bingはグーグルの仕掛けた「罠」にはまって検索結果を真似していることが証明されたとサーチエンジンランドが報じている。
http://searchengineland.com/google-bing-is-cheating-copying-our-search-results-62914

Bingはユーザがグーグルで選択した結果をモニターし、その情報を利用して自分の結果を向上させているというのだ。マイクロソフトのBingサーチディレクターStefan Weitzはグーグルの主張を肯定すると受けとめられる声明をしている。Bingツールバーによりユーザからの「シグナル」を解析し検索エンジンを改善していると認めた上で、この「グーグル実験」はこのシグナルを操作する「ハック」だと言っている。ここでの「ハック」は不法侵入の意味ではなく、素早く実装されたものという意味だ。デベロッパーが勝手にやった非公認のプロジェクトとして企業母体から距離を置ことしているんだろう。

「これちょっとおかしくない?」

5月ごろ、グーグルは間違えたつづりのクエリでBingが同じ結果を出していることに気付いた。グーグルは業界最高のミススペル認識機能を持っていることを誇りに思っている。Bingでもミススペルしたクエリで正解が出てくるようになったのでエンジニアは興味を持った。

10月にcompetitive metricsにおいて二つの不信な変化があった。幅広いクエリにおいてグーグルとBingのトップ10のURLの重複が一月で激増した。トップURLの一致頻度も増加した。結果がグーグルに似るアルゴリズム変化を実施したことになる。IEツールバーでグーグルユーザの挙動データを集め、それを使っているのではないかと疑った。

おとり捜査を決行

この疑いを検証するためにおとり捜査を決行した。このために創始以来始めて手動で特定のキーワードにおいてURLをランキングできる機能を実装した。(これは捜査終了後、取り外すことになっている) そして、実際のユーザがまず入力することのない「合成クエリ」を100個ほど設定した。これらのクエリの結果はこれまではほぼ皆無だった。グーグルはこの空っぽクエリに偽検索結果を返すように設定したのだ。このグーグルが仕掛けた罠以外にこれらの検索結果が出る理由がない。これを出したサーチエンジンはグーグルを真似しているということになる。

誘き寄せ作戦

12月17日。 罠が張られたところで、誘き寄せ作戦が始まる。20名のグーグルエンジニアは自宅からIEでSuggested SitesとBing Toolbarを有効にして偽クエリを検索しトップの結果をクリックするように命じられた。12月31日には偽結果がBingにあらわれてきた。

奇怪な文字列にグーグルとBingが同一のURLをトップに出している。元記事のスクリーンキャプを参照。(「hiybbprqag」を検索) http://www.google.com/search?q=hiybbprqag これが偽結果ページの一つ。この記事のために、これは既に本物のキーワードになっているようだ。

100のうち7,8個の偽クエリにおいてトップURLが一致している現象が確認できた。グーグルにとってはBingが真似していると確信するのに十分な証拠だ。

偽クエリにおいても検索結果全般では揺らぎがあり、Bingがグーグルの結果をそのままパクっているということではない。検証されたのはグーグルの結果をBingがシグナルの一つとして取り入れているということだ。

情報が豊なクエリにおいては自前のシグナルで結果を作成するが、上の偽クエリのようなロングテールで情報が乏しいものにおいてはグーグルからのシグナルが効いてくるようだ。

ユーザの信頼を裏切る行為?

Suggested SitesとBing BarのEUAを解析していいる。企業側に何でも許す言語のEUAに違反はなさそうだ。しかし、ユーザのクリックした他社の検索結果を送り返しすことはユーザの信頼を裏切るものと結論している。

合法性

グーグルは(幸い)このようなことを法律的に争うつもりはなさそうだ。違法とする根拠もあまり無さそうだ。

ルール違反?

競争相手の検索結果に頼るのはサーチエンジンゲームにおいてのルール違反になるというのがグーグルの意見だ。長年苦労して向上してきた、ロングテールの結果をパクられてはかなわないというのが心情のようだ。

グーグルは同じようなことやっていないの?

グーグルもブラウザとツールバーを持っているので同じことができる。しかし、ここで疑われているようなことはしていないと強く主張している。ツールバーからの情報は基本的にランキングに使わない。例外はユーザ環境から観測するサイトのパフォーマンスだ。

タイミング

Bingがマネしているというこの声明のタイミングがグーグルの質低下を指摘したりBingとあまり変りないと指摘する記事が出た直後で、Bing関連のイベントの直前だったと指摘し、そのタイミングの決定に関してい色々憶測している。詳しくは元記事を。

「検索の声」 "Search Voice"

サーチエンジンは自分の「検索の声」(Search Voice)を作るべきだ。米国でヤフーサーチが独自(元inktomi)からBingに切り替えられ、検索エンジンが実質二つになってしまったことを悔んでいる。一方でBlekkoなどの新規参入エンジンに期待を寄せている。

Bingは"Bing is now Google"の略?

Bing開始当時は“Because It’s Not Google”=「グーグルじゃないから」の略だとかいってからかったことを懐古している。それが、"Bing is now Google"=「Bingはグーグルになってしまった」のではないかと危惧している。最後にBingはグーグルに頼らず自分の「検索の声」を探してほしいとくくっている。