【Pick Up!!】『ブログ用語集』始めました!100以上の用語をサクッと解説!

Google Search Console|カバレッジの除外!調べてみた!vol.9

Google Search Console-カバレッジの除外
くま太君

全回のGoogle Search Consoleカバレッジエラーに引き続き、大物案件!
Google Search Consoleのカバレッジの除外について、お勉強していこう!

今回も前回に引き続き、Google Search Consoleの、大物第2弾!と言うところでしょうか?

Google Search Consoleカバレッジの「除外」についてお話していきます。

この除外も、Googleインデックスされない部類に入りますね。

実際、気持ちが悪いですが、Google Search Consoleカバレッジの除外になっても、無視しても問題ないケースもあります。

ですが、Googleインデックスさせたいページも、何らかの理由で除外に入っているケースもありますよね。

これは、対処しないといけない案件です。

・どれが無視しても問題ないケースか
・どれを修正しなくてはならないか

これら除外のケースを知り即座に修正をして、また、除外が出ないようなサイト作りが出来るように、知識の整理をしていきます。

では、ここからスタートです!

「Google Search Console|カバレッジの除外!調べてみた!vol.9の内容は突き詰めると、私の中でかなり膨大な内容になります。
今後気がついたり、補足したい部分は当ページに追加や別ページを立てたりして、少しでも分かりやすく問題解決が捗るように、更新していきます。

この記事を読むと分かること
・Google Search Consoleカバレッジ除外とは?
・除外の種類は?
・除外の修正をするには?

目次

今回の第9回でやる事

くま太君

今回もお困り案件が多数の、Google Search Consoleカバレッジ除外を見ていくね。
エラーに引き続き、除外項目も多いのに驚きだよ。

Google Search Consoleカバレッジの除外でも、エラーに続きGoogleインデックスがされていない状態になります。

除外のワンポイントを知っておくだけでも、除外の対処や、今後なるべく除外を出さないようなサイト作りに、プラスの知識とする事ができます。

今回も、「除外」の概要をまとめていき、除外が出た場合のチェック箇所を明確にしていきましょう。

逆に、「Google Search Consoleカバレッジ除外」を学ぶ事で、正規ページについてや、本当にページを除外したい場合などのケースが理解しやすくなるので、今後のサイト運営にちょっとお得な勉強になります。

Google Search Consoleカバレッジの除外とは

「Google Search Consoleカバレッジ除外」は、Googleインデックスがされていない状態です。

「Google Search Consoleカバレッジエラー」と似たものも多く、何が違うのか?と少々紛らわしいと感じるでしょう。

本来であれば詳細な差異や、中身の理解が出来ているのが最良ですが、Google Search Consoleのプロを目指す訳では無いので、どんなものがあって、何をチェックすれば良いのかが分かれば十分です。

「Google Search Consoleカバレッジ除外」でGoogleインデックスされない、理由としては、

・ページが重複している
・何らかの理由でGoogleインデックスできない
・「エラー」以外の問題が隠れている

と大きく分けられます。

では、1つ1つ内容を確認していきましょう。

Google Search Consoleカバレッジの除外内容

くま太君

ボクも良い感じに除外出しちゃうんだけど……
Google Search Consoleカバレッジの除外には、どんな種類があるんだろう?
除外の種類と内容を見ていこう!

ここでも、Google Search Consoleカバレッジのエラーと同様に、問題なくサイトを運営していると、お目に掛かる機会のない除外も存在します。

また、エラーと違う所と言えば、「自分の意図的操作」により除外にリストされるケースも考えられます

この辺は個人で変わってくるので、気持ち悪いけどこの除外はOK!など区分けして考えておきましょう。

では、どんな除外が検出されるのか、確認していきましょう

noindex タグによって除外されました
②ページ削除ツールによりブロックされました
robots.txt によりブロックされました
④未承認のリクエスト(401)が原因でブロックされました
⑤クロール済み – インデックス未登録


⑥検出 – インデックス未登録
⑦代替ページ(適切な canonical タグあり)
⑧重複しています。ユーザーにより、正規ページとして選択されていません
⑨重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
⑩見つかりませんでした(404)


⑪ページにリダイレクトがあります
⑫ソフト 404
⑬重複しています。送信された URL が正規 URL として選択されていません
⑭アクセスが許可されていないため、ブロックされました(403)
⑮その他の 4xx の問題が原因でブロックされました

くま太君

Google Search Consoleカバレッジエラーの項目より多いじゃん……
こんなに対応できないよ……

読むのも嫌になる程、除外の種類がありますね。

うまくいけば?一生出会わなそうな除外もありそうですが、プチ知識として全体を眺めておきます。

Google Search Consoleカバレッジのエラーの所でもお話しましたが、全体像が何となくでも見えている事で、

・修正などの次の行動が起こしやすくなる
・そもそもエラーを出さないようなサイト作りが出来る

と、今後のサチコさんとの向き合い方が楽になります。

なるべく簡単にご案内していきますので、頑張って読んでみてください(笑)!

①noindex タグによって除外されました

Google Search Consoleのカバレッジエラーの所でも出てきました。
Google Search Console|カバレッジのエラー!調べてみた!vol.8

noidexはどんなものかと言うと、

・Googleインデックスさせたくないページに付するタグ

の事でした。

Google Search Consoleのカバレッジエラーの場合は、

「noindexタグ」が入っていて、Googleインデックスさせない申請のタグが付いているのに、「sitemap.xml」で送信された内容では、Googleインデックスさせる申請になっており、齟齬がある

と言うのが大きな原因でした。

対して、Google Search Consoleのカバレッジ除外の場合は、正確にページの除外申請がされている状態です。

そのため、「noindex」が付されているページが、この「noindex タグによって除外されました」に、表示されています。

ここが意図している場合であれば、問題ありませんが、意図せず「noindex」となっている場合は修正が必要です。

②ページ削除ツールによりブロックされました

「URL削除リクエスト」によりブロックされている状態です。

・「URL削除リクエスト」でのブロック期間は90日

この90日期間が過ぎれば、再度クロールされ、ページがGoogleインデックスできる状態であれば、インデックスされます。

Google Search Console-カバレッジの除外-削除ページ
Google Search Console/削除ページ

上の図が削除リクエストの画面です。

もし、ページを削除したいが為に、「URL削除リクエスト」を利用していたのなら、「noindex」を利用して、ページをGoogleインデックスさせないように修正しましょう。

「URL削除リクエスト」だと、90日経つと復活しちゃうので!

「noindex」を利用するなら、「sitemap.xml」から対象URLの除外処理を、忘れないようにしましょう。

でないと、今度はGoogle Search Consoleのカバレッジ「エラー」として出現してしまうので、注意が必要です。

③robots.txt によりブロックされました

そのままなのですが、robots.txt ファイルによってページがブロックされています。

Google Search Consoleのカバレッジエラーでも、robots.txt について触れていますので、確認してみてください。
Google Search Console|カバレッジのエラー!調べてみた!vol.8

「robots.txtテスター」でチェックして修正します。

もちろん、意図的な設定であれば、問題ありませんが、確実にページをGoogleインデックスさせたくないならば、「noindex」の利用がおすすめです。

④未承認のリクエスト(401)が原因でブロックされました

これもGoogle Search Consoleのカバレッジエラーにもありましたが、ページに認証があると引っかかるエラーです。
Google Search Console|カバレッジのエラー!調べてみた!vol.8

ブログ内で、ログインページのコンテンツを作っていたりする場合等が該当します。

認証を解除するか、ページにアクセスしたのがクローラーであることを確認させます。

⑤クロール済み – インデックス未登録

クロールがされているが、Googleインデックスされていない状態です。

今後Googleインデックスされるかもしれないし、されないかもしれません。

しばらく様子をみても改善しない場合は、リライト(ページの修正)をするなど、ページを更新してみましょう。

⑥検出 – インデックス未登録

Googleに検出されていますが、まだクロールがされていない状態です。

クロールしようとしたものの、サイトへの過負荷が予想され、クロールがストップしてしまっています。

⑦代替ページ(適切な canonical タグあり)

正規ページが正しく存在しているため、「除外」にでたURLが重複として残っています。

正規ページが存在しているので、特に問題ありません。

「canonicalタグ」とは、URLを正規化することです。
つまり重複コンテンツがあった場合、「canonicalタグ」を付したURLが、正規ページとして認識されGoogleインデックスされます
他の重複URLはGoogleインデックスされないので、この「代替ページ(適切な canonical タグあり)」として、Google Search Consoleのカバレッジ「除外」に表示されます。

⑧重複しています。ユーザーにより、正規ページとして選択されていません

先の「代替ページ(適切な canonical タグあり)」に似ていますが、こちらはページが重複していて、正規ページがない状態です。

「canonicalタグ」を用いて、正規ページを設定しましょう。

⑨重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました

こちらも重複案件ですが、自分で正規ページを設定したはずなのに、Google側で別のページが正規ページとして適切とし、そちらをGoogleインデックスされている状態です。

Google Search Console-カバレッジの除外-正規URL
Google Search Console/URL検査結果

「URL検査」で、Googleが選んだ正規ページを調べる事ができるので、正規ページ設定をし直した方が安心でしょう。

⑩見つかりませんでした(404)

404エラー、削除などでページが無い時に出るエラーですね。

このページへは、クローラーの頻度は徐々になくなります。

意図的な削除の場合は問題ありません。

ですが、ページを移動させた場合(URLを変更した)は、301リダイレクトを使用して、ページを転送しましょう

くま太君

ちょうど、301リダイレクトについて、以前記事にしたんだ!
よかったら、確認してみてね。

リダイレクトって何だ?という事から説明しているよ。

WordPress301リダイレクトを.htaccessで設定!プラグインは使いません!

⑪ページにリダイレクトがあります

URLがリダイレクト(別URLに転送)されているので、Googleインデックスされていません。

意図的のものであれば問題ありませんが、不用意なリダイレクトであれば修正しましょう。

⑫ソフト 404

ページが無い、若しくは空白コンテンツと認識されています。

クローラーに適切に読み込まれなかったり、重要な要素が欠けている場合があります。

まずは、「URL検査」を使って、何が問題なのか探りましょう。

⑬重複しています。送信された URL が正規 URL として選択されていません

正規URLを申請して送っているのに、Google側で他ページの方が適切!と判断している状態です。

そのため、Googleインデックスは、Googleが指定したURLが表示されます。

「URL検査」で、Googleが選んだ正規ページを調べる事ができるので、正規ページ設定をし直した方が安心でしょう。

⑭アクセスが許可されていないため、ブロックされました(403)

ここもサイト内の認証が関係しています。

このエラーを修正するか、robots.txt または noindex でこのURLをブロックする必要があります。

⑮その他の 4xx の問題が原因でブロックされました

ここで説明されていない、その他のサーバー側の問題になります。

「Google Search Console|カバレッジの除外!調べてみた!vol.9の内容は突き詰めると、私の中でかなり膨大な内容になります。
今後気がついたり、補足したい部分は当ページに追加や別ページを立てたりして、少しでも分かりやすく問題解決が捗るように、更新していきます。

今回のまとめ。

くま太君

ボリューム満載だった……
全部覚えられない自信は満載だよ!

今回も内容盛り沢山!Google Search Consoleカバレッジの除外について、まとめてみました。

noindex タグによって除外されました
②ページ削除ツールによりブロックされました
robots.txt によりブロックされました
④未承認のリクエスト(401)が原因でブロックされました
⑤クロール済み – インデックス未登録
⑥検出 – インデックス未登録
⑦代替ページ(適切な canonical タグあり)
⑧重複しています。ユーザーにより、正規ページとして選択されていません
⑨重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
⑩見つかりませんでした(404)
⑪ページにリダイレクトがあります
⑫ソフト 404
⑬重複しています。送信された URL が正規 URL として選択されていません
⑭アクセスが許可されていないため、ブロックされました(403)
⑮その他の 4xx の問題が原因でブロックされました

かなりの数の除外項目がありますね。

この項目を大別すると、

・ページが重複している
・何らかの理由でGoogleインデックスできない
・「エラー」以外の問題が隠れている

これらの問題により、Google Search Consoleカバレッジの除外に表示されているページは、Googleインデックスに登録されていません

中には、意図的に設定したために、「Google Search Consoleカバレッジの除外」として、表示されているURLもあります。

意図的な部分は、特に修正することはありませんが、そうでない場合、せっかく作ったページがGoogleインデックスされていない状態になるので、「URL検査」や「robots.txt テスター」を用いて、何が問題なのか探り、修正していきましょう。

Google Search Consoleカバレッジの除外の具体的な修正方法について、また後日UPしようと思います。

ここまでお読みいただき、ありがとうございました。

お疲れ様でした。

<<< Google Search Console|カバレッジのエラー!調べてみた!vol.8

☆読んでくれてありがとう!よかったらシェアしてね!☆
目次