Search Console「クロール済み – インデックス未登録」ページの特徴

ブログをご覧いただいている方で、このテーマに悩んでいる方が多いようですので、改めて取り上げてみます。
折角コンテンツを増やしたのに、Google に拾われないのは、困りますよね。ページを増やす度に、いくつかのページが、Search Console のカバレッジレポートの除外、「クロール済み – インデックス未登録」に分類されてしまうことを完全に避けることは難しいです。

Search Console で急に「クロール済み – インデックス未登録」になってしまう” に具体的な理由も挙げていますが、これに当たらなくとも、「クロール済み – インデックス未登録」に分類されてしまうことがあります。

Google は、検索エンジンデータベース上に存在する、Webページの情報と、クロールしたあなたの Webページの情報を比較し、似たような情報が他にないか、また、すでに存在している似た情報よりも価値が高いかを判定します。
この結果、あなたの Webページの情報が目新しい物で無ければ、「クロール済み – インデックス未登録」に分類されてしまうわけです。

テキスト量が短いとこの原因に適合する確率が当然高くなるわけで、一般的にテキスト量を増やしましょうという解決策が挙がってきたりもします。ただ、いくらテキスト量を増やしても、上記の判断基準で除外となってしまう範囲をクリアしなければ、解決はしません。
とはいえ、人間ではとてもではありませんが、似たコンテンツがないかを調べることが不可能な話ですので、簡単にこの疑念に答えを得る方法を解説したいと思います。

  1. まず準備として、Search Console にログインし、カバレッジレポートから「クロール済み – インデックス未登録」に分類されてしまったページリストをエクスポートしておきます。(以降、「レポートA」と呼びます。)
  2. 次に、Google に改めてクロールしてもらう必要があるのですが、サイトマップを更新して申請するというサイト全体ではなく、レポートA の対象ページを個別に Search Console から申請してください。これで準備は終わりです。
  3. 1週間ほど待ち、再び、Search Console にログインし、カバレッジレポートから「クロール済み – インデックス未登録」に分類されてしまったページリストをエクスポートします。(以降、「レポートB」と呼びます。)
  4. 「レポートB」の前回のクロールを確認し、「レポートA」と同じであれば、意図的に Google から無視されていることになりますので、インターネット上のどこかに似たコンテンツがある疑いが高いです。そのページは内容を書き直しましょう。

 

「レポートB」の前回のクロールが最新になっていて、それでも除外されている場合は、”Search Console で急に「クロール済み – インデックス未登録」になってしまう” の原因に当てはまっているか、テキスト量が少なすぎるページの可能性が高いです。

上記の方法や見解は、Google がアナウンスしているものでは無く、筆者の経験上の話ですので、全てに当てはまるとは言い切れませんが、参考になる方法の一つですので、お試しください。