Communes

Googleインスタントプレビュー疑惑?

なんかGooglebotだけでは無いことが確定

いちおうグーグルインスタントプレビューは以下のエージェント。クロームと同じSafariです。

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/534.51 (KHTML, like Gecko; Google Web Preview) Chrome/12.0.742 Safari/534.51

うちは逆アセンブリして手入れしたSafari改を使ってるのでクロームは使う気がさらさらありませんが・・・

今回問題のポイントは

Googleインスタントプレビューでは

Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

という新しいエージェント(ていうかもともとのrobot.txtを違法ハックするグーグルのBOTサーバのUA)になってくるはずが、なんと、ログを見ると

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/534.55.3 (KHTML, like Gecko) Version/5.1.5 Safari/534.55.3

確かにIPアドレスはグーグル方面・・・

たまになんか検索してみてみると、私のアップしたコミュネス動画のサムネイルが徹底的におかしくなってる。てかサムネが作られていない。コミュネス事務局に聞いたら、グーグルの公開仕様に基づいて正しくインスタントプレビューに従ってUAをもとにサムネイルさせるページを起こしているとの話し。しかしそれが正常になっていない。もちろん風景のデジカメの普通の動画でアウト。別にアニメとかライセンスに触れるものでなく、インスタントプレビューが出ない。

インスタントプレビューに失敗している理由は、これか?

ただのパソコン向けブラウザだよね?どうみても・・・・ どこにもgoogleのUAもなければBOTのUAも無い・・・・

それじゃ正しくインスタントプレビューが作成されないワケですね。仕様書というか、改造して結果的にこうなっちゃったわ的な事後の報告書をあちらでは「仕様書」と言ってるのでしょうね・・・・・ すごいワンマン企業だと思いました・・・

まさかプレビューを作るためのマシンが不足していて、Lunux寄せ集めてとりあえずPythonエンジンでSafariの描画メモリーだけ抽出してイメージ化してたとか? 実験しながらサービスって・・・どんな個人サイトだよ、おい。グーグル・・・

どんなサイトもそんなことはしないそうですから、なんかちょっと怖いですよ。

いちおう、いまのところ、インスタントプレビューに関しては99%以上はUAの判定でbotで判定すれば確実みたいということでした。私がよくいく某SNSサイトの情報です。膨大な数ギガのログから判定したところ、UAの判定ではstristrあたりでgoogleではダメで、botで判定してください、ということでした。googleという表記が含まれないgoogleインスタントプレビューが存在するとのことです。

また例のごとく、買収企業のサーバを使ってるのでしょうね。UA書き換えが追いつかないのでしょうね。書き換える気もないのかも知れませんね。サーバーのレプリケ増設中では、こうした生UAだけでプレビューが作成されるケースが存在し、実はそれはかなりの数に及ぶようです。(そこまで対策しているサイトであれば違いが明白ですが、まあ普通のブログやホムペはそんなことすらハテナ?状態でしょうから問題視されることもなかったのでしょうね。)

旧サーバでのサービス開始・サーバ増設直後のエージェントとか
(botとかgoogleとか付かないインスタントプレビューUAも存在する)
http://d.hatena.ne.jp/chiheisen/20101123/1290530840

公式ブログによると、robot.txtにより拒否されていたとかヌカしていますが・・・・
http://googlewebmastercentral-ja.blogspot.jp/2011/07/blog-post.html
どれだけrobot.txtで膨大なクロールを5分周期にお願いしても「ガン無視・違法ハック」しまくってきたグーグルですが、ここまで堂々とインターネット上でウソを公式ブログで書けるなぁと、それに携わってる日本人がいるのですが、同じ日本人として世界の恥と思います・・・・

おしまい。

Trackback URL: トラックバック用URLを生成するには、JavaScriptを有効にしてください。

No trackbacks

コメント(0)



エモティコン
投稿から7日が経過した記事のコメントはスパム防止のため簡単なクイズにお答え下さい
個人情報を記憶
通知
アドレス非表示
注意: 使用できるタグは <b> と <i> のみです。URLやメールアドレスはそのまま記述すればリンクになります。
Copyright (C) 2024 Communes ™ All Rights Reserved.