悪のニュース記事

悪のニュース記事では、消費者問題、宗教問題、ネット事件に関する記事を収集しています。関連するニュースを見つけた方は、登録してください。

また、記事に対するコメントや追加情報を投稿することが出来ます。

記事登録

2003年06月19日(木) 00時30分

Google の誤認japan.internet.com

「クローラーにページが認識されない!」という声を耳にすることがある。よくよくサイトを拝見すると、拡張子が微妙に違うファイルが複数存在している。クローラーがデフォルトで認識するファイルは「index.html」「index.htm」のいずれかである。

例えば、Google の検索 BOX に次の検索式を入力してみて欲しい。
「link:http://www.seo-ch.jp/」
「link:http://www.seo-ch.jp/index.htm」
「link:http://www.seo-ch.jp/index.html」
検索結果は皆同じである。

しかし、弊社サイトの TOP ページは「default.asp」である。「link:http://www.seo-ch.jp/default.asp」で検索しても何も見つからない。クローラーは ROOT のデフォルトファイルを「index.html」「index.htm」として認識するのである。

上記のことから言えることは、現状で「index.html」「index.htm」の2ファイルを別ファイルとして存在させていても、クローラーが認識するファイルは「index.html」のみなのである。もし、サイト内で「default.asp」などを TOP ページとして設置している場合は、クローラーの誤認を防ぐ為、TOP ページへリンクを「/」(スラッシュ)で終わらせておくと良いだろう。サイト外からリンクを取得する際も「/」で取得しておけば、サイト TOP ページへのリンクが確実となるのだ。

上記のファイル認識以外にも、サーバーのマルチドメイン設定などは、クローラーは認識できないのである。マルチドメインを使用して、2サイト立ち上げたつもりでも、クローラーは1サイトの認識しか出来ないのである。URL の変更などを考えた場合、新 URL を認識させる為には、マルチドメインは避けた方が良いだろう。

(執筆:棚橋繁行、監修:信太明)

記事提供: アウンコンサルティング株式会社


最新ITニュースメールの購読申込はこちら
http://japan.internet.com/mail/newsletters.html (japan.internet.com)

http://headlines.yahoo.co.jp/hl?a=20030619-00000001-inet-sci

この記事に対するコメント/追加情報を見る

ニュース記事一覧に戻る

トップページ