ラベル ブログ の投稿を表示しています。 すべての投稿を表示
ラベル ブログ の投稿を表示しています。 すべての投稿を表示

2012年1月14日土曜日

新ブログをGoogle検索結果に表示させるぞ大作戦2(新サイトのインデックス登録)

自分のサイトを検索サイトのインデックスへの追加をお願いする仕組みがいくつかあるようです。

ping
Googleの場合は次のサイトがブログ登録フォームになっています。
http://blogsearch.google.co.jp/ping
画面のテキストボックスにインデックス登録したいブログのアドレスを記入して送信するだけです。

登録フォームを介さず直接登録もできます。
やり方は、下記アドレスをブラウザのアドレスバーに打ち込みます。
http://blogsearch.google.co.jp/ping?url=(URLアドレス か RSSフィード)

例えば、bloggerの場合は以下のようになります。
http://blogsearch.google.co.jp/ping?url=http://(自分のサイト名).blogspot.com/

さて、「RSSフィード」ですが、BloggerではATOMフィードが取得できます。
例えば、
http://(自分のサイト名).blogspot.com/atom.xml
または、
http://(自分のサイト名).blogspot.com/feeds/posts/default
で取得可能です。

2つめのものはファイルの形ではないように見えますが、ちゃんとxmlが返ってきます。
そして、クエリが使えます。こんな感じです。
  • http:// (自分のサイト名) .blogspot.com/feeds/posts/default?orderby=updated
  • http:// (自分のサイト名) .blogspot.com/feeds/posts/default? max-results=500
それぞれ、25件まで更新順、最新500件のデータが取得できます。

ウェブマスターツールによる操作
Googleウェブマスターツールを開きます。
Bloggerでサイトを作成している場合、ウェブマスターツールにはすでに自分のサイトが表示されていると思います。これがリンクになっているので、クリッククリック。

以下、インデックス登録に役に立ちそうな機能です。

「サイト設定」→「サイトマップ」
RSS・ATOMフィード(前述)を登録して、インデックス作成対象として認識してもらいます。
「サイトマップを送信する」ボタンをクリック、自分のサイトのRSS・ATOMフィードを指定して「サイトマップ送信」をクリック

「診断」→「Fetch as Googlebot」
指定したURLをGoogleインデックスへ送信できます。
テキストボックスにサイトのURLを指定し「取得」した後、"インデックスに送信"のリンクをクリック


「サイト設定」→「クローラのアクセス」
サイトのコンテンツをクロールする方法を指定し、テストすることができます。



[参考サイト]
Blogger に移転してから検索にヒットしない?

Blog のプロモーション(Google)

2012年1月13日金曜日

新ブログをGoogle検索結果に表示させるぞ大作戦1(旧サイトのインデックス削除)

昨日からこのブログがGoogleで検索しても表示されないことで悲しんでいたのですが、いつまでも悲しんではいられません。
このブログをGoogle検索結果に表示させる作戦を立てるべく、得意のインターネットでいろいろ調べて、やってみました。

検索サイトがWeb検索を行う仕組み
まず、Webロボット(ロボジーのようなロボットではなく、プログラムですよ)がインターネットのそこかしこを泳いでサイト情報を集め、内容を分析して索引(インデックス)を作成します。
検索サイトのサーチエンジンはこのインデックスを元に検索結果を作成・表示するので、自分のサイトやブログが検索結果に表示されるためには、このインデックスに登録されている必要があります。

インデックスが作成されるにはサイトを新規作成してからしばらく時間がかかるみたいです(ロボット君がんばって泳いで)。
せっかちな人はこのロボット君にインデックスを作ってもらうように依頼することができるようです。
また、逆に検索されないようにすることもできます。

問題なのは、
他のブログサイトから移行したときで、移行前のサイトがそのまま検索結果に表示されてしまうという状況になってしまいます。(もしかしたら記事内容が同じものだとまずいのかもしれません。こちらは未調査)
そこで、まずは旧サイトをどうにかしないといけないな、ということになります。
私はWordPress.comから移行してきましたので、次のことをやらないといけなんでしょう。

  • WordPress側に何か設定をして、検索サイトから検索されなくする。(Googleさん無視してもらう)
  • Googleさん側で WordPressサイトを検索できないように設定する。
調査の結果、WordPress側に呪禁を施したrobots.txtをサイトのルートに設置するか、下記のような呪文をサイトに書くとインデックス作成対象外になるそうです。
<meta name='robots' content='noindex,nofollow' />
しかし、残念ながら自分の使っていたWordPress.comはこのようなことを直接行う術がなさそうです。
そこで、WordPressのダッシュボードから設定します。

WordPressでのインデックス禁止設定
ダッシュボードにて、「設定」→「プライバシー」
"検索エンジンによるサイトのインデックスを許可しない。"
を選択して、「変更を保存」をクリック

これでおそらく、下記ファイルができあがるのではないかと思います。
http://(自分のブログ名).wordpress.com/robots.txt

そして、このファイルの中身はこうなっています。完全にお断りモードです。
User-agent: *
Disallow: /

これで次回クロール時にインデックスが削除されそうです。

せっかちな方はウェブマスターツールからURL削除リクエストが可能です。
削除要件を満たしておく必要がありますが、WordPressの上記手順を実施していれば問題なさそうです。

GoogleウェブマスターツールでのURL削除リクエスト
まずはこの記事の手順を実施。
その後、ウェブマスターツールより、登録したWordPressサイトを選択して下記を実施します。

「サイト設定」→「クローラのアクセス」→「URLの削除」タブ を表示
「新しい削除リクエストを作成」をクリックし、削除するサイトのURL(つまり、旧ブログサイトのURL)を入力して「続行」をクリック
確認画面で「リクエストを送信」をクリック

これでよし。
。。。思ったんだが、ステータスが結構長い時間保留中になっている。
しばらく待つかな。


2012年1月14日追記 ウェブマスターツールを見ると、ちゃんと削除されていました。

2012年1月12日木曜日

Google検索でこのブログサイトが検索できない。

せっかくBloggerで書いているのに。
まだインデックスされてないんだろうか。
しばらくしたらクロールしてくれるかな。