Googleウェブマスターツールで発見したインデックスステータスの「未選択」の謎の急増。とりあえず、ページ内にGoogle検索エンジンを埋め込んでいるページや、#を使ってリンクを飛ばしているページ、index.htmlなどの重要なページの変更は完了したよ。テキストエディタを使って、キーマクロとかで何とかならないかなって考えながら作業していたんだけど、それぞれ個別のURLを記述していかなくちゃいけないから手作業しか思い付かなかった・・・
じっくりと考えてみたんだけど、#を使ってリンクを飛ばしているページは、日記が多いんだけど。その他、図鑑で何ページがある程度かな。日記なら1ヶ月30日なら30個のリンクが張られることになるけど、それでも30倍。図鑑のページでは1ページに1個〜20個くらいだから、平均すると10倍。index.htmlはURLありとなしで、2倍。
どんなに多く見積もっても、600倍になんてならないんだよね。1ページから600個もリンクを貼ったりなんてしていないし、リンク切れはすでに修正しているし、CGIはメールフォームしか使ってないし。クロールされて未選択になったURLがわかればいいんだけど、ウェブマスターツールにはそこまでの機能は実装されていないし。だから、原因を自分で想像するしかなくて。
そこで思い当たることといえば、もしかしたらページ内に掲載しているGoogleの検索エンジンが原因なのではないかと。検索結果がページ内に表示されるので、検索するたびに新しいURLが表示されるんだよ。普通のブラウザを使っていれば、このURLにリンクが張られているわけじゃないから、何の影響も受けないんだけど。Googleブラウザの「Chrome」を使っていると、閲覧したURLがGoogleのサーバーにアップロードされているんじゃないかと推測してみた。
もしChromeを使ってサイト内検索を行えば、そのたびに表示された検索結果のURLがGoogleのサーバーにアップロードされて。とんでもない数の未選択ページが生まれるのではないかと・・・
Googleのサイト内検索エンジンを掲載したページには、「link
rel="canonical"」でURLを指定しておいたんだけど。更新したばかりなので、結果はまだわかんない。「link
rel="canonical"」でURLを指定するより、検索結果の表示方法を変更した方がいいのかもしれないなー。 |