基本的にあんまり検索ランキングをあげるためにSEOを行うって考え方は好きではない。
PageRankを稼ぐためにスパムギリギリの手法を取る業者がいて、検索結果が激しく劣化するのは検索サイトの利用者にとって明らかに不利益だ。
だから、そういうSEOのテクニックを使う事はあんまりしないんだけど、このドメインをGoogleで検索してみてあきらかに問題があると感じたので調整だけはする事にした。
検索したキーワードとほとんど一致しないページが大量に検索結果に出てきてしまうのだ。
問題はMovableTypeの標準テンプレートにあった。
MTでは基本的に、個別のページ(permalink)とその内容のコピーを含むインデックスページ、カテゴリアーカイブ、日別アーカイブなどが生成される。
さらにそれぞれのテンプレート内にはタギングされたキーワードの検索結果ページへのリンクも含まれる。
こうした状態にあるサイトがGoogleによってクロールされると、同じ内容のテキストを含むページが大量にインデックスされてしまう。
そしてインデックスページやアーカイブページはたいていの場合、時期がたつと載っているコンテンツは新しい物に書き換えられる。
このためMTで構築されたサイトがGoogle検索される時にはトップページ、各種アーカイブページ、パーマリンク、そして検索ワードがなんらかのタグ名に含まれている場合にはすべてのタグ検索結果ページ…と膨大なページがヒットする。
しかし、検索結果の中で確実に検索された情報を含んでいるページはパーマリンクのみであってアーカイブページやインデックスページは多くの場合古くなっていて役に立たない。
さらに最悪なのはタグ検索結果のページで、検索結果の標準テンプレートにはタグクラウドが含まれているため、検索ワードがタグ名に含まれていた場合には全てのページが検索結果にヒットしてしまう。
Googleのサイト内検索でこのブログからSleipnirを検索すると佐井祐里奈さんのタグ検索ページとかまで含まれている。
どう考えてもSleipnirの情報を探してやって来た人にとってはノイズになってしまっている。
これらの問題は標準のMTのテンプレートでノイズデータの事が考慮されてないのが原因だろう。
さすがにマズイと思ったので対策をいくつか施してみた。
- 個別アーカイブ以外のアーカイブにmetaタグでNOINDEXを入れた
- 検索結果ページを含むMTのcgiディレクトリをまるまるROBOTS.txtではじく
- メインインデックスにはGooglebot向けにmetaタグでNOSNIPPETを入れた
- Googleウェブマスターツールを使って検索の邪魔になるゴミデータをすべて削除申請
まだ施したばかりで結果は出てないんだけど、こんなもんで良いのではないかなと。
基本方針としてはGoogleで引っかかるべきはトップページとパーマリンクのみで良いって事で。
ユーザーの検索の邪魔になるようなページは最初から一切インデックスさせない事で、確実に情報のあるページにだけ誘導する訳です。
トップページに関してはアーカイブページと似たような構成になっているのでそのままだと検索の邪魔になりますが、かといってインデックスから削除させるわけにもいかないサイトの顔でもあるのでGoogleさんにテキストデータだけを削除して貰います。
そういう時に使う便利な指定がNOSNIPPETです。
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">カテゴリ・アーカイブ、日別アーカイブのheadに追加
<meta name="ROBOTS" content="NOINDEX">サーバのルートにはインデックス拒否したいディレクトリを書いたrobots.txtをおく
User-Agent: * Sitemap: http://glassleaf.info/blog/sitemap.xml Disallow: /x/ Disallow: /blog/search/ Disallow: /blog/tag/サイトマップファイルにはトップページとパーマリンクだけ(sitemap.xml)
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc><$MTBlogURL encode_xml="1"$></loc> <lastmod><$MTDate utc="1" format="%Y-%m-%dT%H:%M:%SZ"$></lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> <MTEntries lastn="9999"> <url> <loc><$MTEntryPermalink encode_xml="1"$></loc> <lastmod><$MTEntryModifiedDate utc="1" format="%Y-%m-%dT%H:%M:%SZ"$></lastmod> <changefreq>never</changefreq> </url> </MTEntries> </urlset>
果たして成果は出るのか!?










