コピーページに関する実験をしてみた結果

Google のヘルプやフォーラムによく「(検索エンジン)スパム」に関する話題があります。その中で多いものの一つに『他のページのコピーとして認識されて云々』という話題があります。
このコラムでもいくつかの記事でこの手の話題に触れていましたが、実際に私が実験した結果をお伝えしたいと思います。

内容( HTML などのクライアントサイドスクリプトは無視し、テキストのみ)の 60% 程度が一致するページが、ドメイン A とドメイン B にあったとしたら、ドメイン A あるいはドメイン B どちらか一方のページだけ、Google の検索結果に掲載される可能性が高く、もし、その 2 つのページがリンクしている場合、確実に片方しか表示されない。
そして、どちらが表示されるかは、Google にとって価値が高い(被リンクが多いとか、ドメインの存在期間が長いとか諸々)ドメインの方である。

ということになりました。統計学的に試行した母集団の数量が十分ではないので、あくまでもご参考までに程度ですが、個人的にはほぼ確実と言える条件だと思っています。