‘xml’ タグのついている投稿

検索エンジンに記事を効率よく収集してもらうためのプラグイン「Google (XML) Sitemaps Generator for WordPress」

2008 年 9 月 25 日 木曜日

検索エンジンのクローラ(検索結果に表示されるWebページを収集するプログラム)は,Web中の膨大なページを徘徊しながらWebページを収集して来ます。しかしWebページは膨大な数存在しています。そこでクローラは,多くの人が必要としているであろうWebページを優先的に,頻繁に収集します。

では,出来たてで,かつ内容も濃くない,このサイトのようなページが検索エンジンに検索されるためにはどうしたらよいのか。待っているだけでは,クローラはいつやってくるのか…むしろずっと来ないかも!?

「だったらこっち(Webページの管理者)がページのデータを提供してやればいいんだ」ということで,Google (XML) Sitemaps Generator for WordPressを導入しました。このプラグインは,検索エンジンにページのデータを提供するためのXMLデータを自動生成してくれます。

導入はとても簡単です。

  1. プラグインをダウンロードして,解凍してできたディレクトリごと’wp-content/plugins/’にアップロード
  2. 「プラグインの管理」画面から,Google XML Sitemapsを有効化

たったこれだけ。あとは記事を投稿するたびに,http://(blogのアドレス)/sitemap.xmlが自動的に生成されるようになります。詳しく設定を行いたければ,管理画面から行えます。

さて,このプラグインの機能で,記事の投稿の度に,いくつかの検索エンジンに対して更新されたことを通知してくれるようになります。そのおかげで,検索エンジンがページを収集し,検索結果に出現する可能性が上がりました。

しかしこれだけでは本来の目的である「こっちからデータ提供する」が達成できてません。ということで,とりあえずメジャーな検索エンジンであるGoogleに,データの場所を登録しましょう。

  1. Googleウェブマスターツールにアクセス,ログイン。
    Googleのアカウントが必要です。持っていない場合は作成しましょう。
  2. 「サイトを追加」ボタンの左のフォームに自身のブログのトップページのアドレスを入力し,「サイトを追加」ボタンをクリック。
  3. 「統計情報」などのリンクをクリックすると「サイトが確認されていない」と表示されると思います。確認方法が2種類提示されると思うので,どちらかの方法を実行します。
    WordPressの生成するMETAタグを編集する技術があるならばMETAタグを編集するもよしですが,簡単なのは空ファイルの生成。Googleから提示されたランダムな文字の羅列の名前を付けた空ファイルを,blogのアドレス直下に作成してください。
  4. 無事確認が完了したら,「サイトマップ」メニューからサイトマップを追加します。「一般的なウェブページのサイトマップを追加」を選択し,あとはサイトマップのファイル名sitemap.xmlを入力。ファイル名を設定で変更している場合は,確認してください。

これで,「こっちからデータ提供する」の目標達成。あとはGoogleのデータベースに記事が登録されるのを待ちましょう。Googleウェブマスターツールの面白いところは,次のような様々な情報を確認できるところでしょうか。

  • サイトのページの表示に最も多く使用された検索クエリ,クリックに結びついた検索クエリ
  • サイトのページの現在のPageRankなどのサイト情報
  • blogリーダへの登録状況
  • これ以外にもいろいろと…

まあ,このページがどれだけ検索されるか,人の役に立つかはわからないけど,せっかく書いているんだし,どうせならちょっとでも読んでもらえる機会を作っとこうかなあと。

あと,WordPress導入時にプライバシー設定を「検索エンジン拒否」にした場合は,一般設定>プライバシー設定から,「このブログを、検索エンジン (Google、Sphere、Technorati など) とアーカイブサイトを含め、誰でも閲覧できるようにする」に設定を変更することを忘れずに。