Search Console で急に「クロール済み – インデックス未登録」になってしまう

このサイトのように、日々コラムを追加していると、日々 Search Console のカバレッジ(Google に認識されているページ数)が楽しみになります。
ですが、突然、何の規則性も脈絡も予兆も無く、カバレッジの「除外」ページ数が増えていたりします。何故だ!?と思い、詳細を見てみると「クロール済み – インデックス未登録」の数字が増えている・・・。

傾向として、CMS で管理しているコンテンツに発生することが多く、おそらくは Google が問題視している、量産されたコピーページに類すると分類された可能性が疑われます。

この「クロール済み – インデックス未登録」の多くの場合の実態ですが、まず、検索結果には登録されています。試しに、https:// を削除した URL で検索してみると、検索結果にそのページが出てくることでしょう。
ですが、<TITLE> の内容などで検索しても出てこない。いわば、ページは Google に登録公開されているが、キーワード付けがされていないという状態を指しています。(※)

結論的には、明確な原因特定と対応はありません。(Google が理由を開示していませんので。)ある程度時間経過で解決することもありますが、一応以下を確認してください。

  1. Search Console で当該ページの “URL 検査” を行います。エラーが出ていれば、そのエラーを解消させるべく対応し、URLを送信するか、放置しておけば時間が解決します。
  2. 1でエラーが出ていない場合、「URL は Google に登録されています」と出ていると思います。この場合は、以下の画像の赤枠部「インデックス登録をリクエスト」をクリックします。
    Search-Console-インデックス登録01
  3. 「インデックス登録をリクエスト」をクリックすると、登録できるかを Google が検証するダイヤログが表示されます。
    Search-Console-インデックス登録02
  4. 手順3 の状態に続いて、以下のダイヤログが出れば完了です。
    Search-Console-インデックス登録03

以上の手順を行った後、数日経っても解決しない場合は、以下の様な点を疑ってみることです。

  • <TITLE>、<META> が、他のページと全く同じ、あるいはほぼ同じである。
  • HTML のバージョンが入り乱れたコーディングになってしまっている。あるいは、そもそも HTML 構文にミスがある。
  • ページの見出しに該当する部分(<TITLE> <META desctiption> <H1> <H2> <H3> 内のテキスト)と、本文の内容が一致していない。
  • 複数の URL で同一ページが表示されてしまっている。(CMS を使っていると、動的 URL でも 静的 URL でもアクセスできたりするので、それです。)

 

上記に該当する場合は、これらが原因である可能性が高く、解消した上で、再度上述の手順1 ~ 手順4 を行ってください。

Google Search Console は、多くの知見をもたらす便利なツールですが、全てを教えてくれるわけではありません。Google が提唱するガイドラインなども目を通し、サイトの成長が集客へと直結する方法論を確立しましょう。

※キーワード付けもされている場合もあります。この場合は、最新のクロール時点の偶発的なアクセスエラーや、すでにアップされていたページ内容の更新で再評価されている最中、つまり更新以前のキーワード付けがされており、新しいキーワード付けはまだされていないということがありえます。