Googlebot は HTTP/2 プロトコルをサポートします。すぐに利用可能

September 17, 2020

2020 年 11 月から、Google は HTTP/2 を介して一部のサイトのクロールを開始します。これは HTTP の次のメジャー バージョンであり、以前のバージョンよりも堅牢で効率的で高速です。この変更は、HTTP/2 を介したクロールをサポートするために Googlebot を必要とするウェブ プロフェッショナルに役立ちます。 HTTP/2 の詳細については、HTTP/2 のトピックに関する長い記事をお読みください。

Google は、サーバー リソースの使用に関してより効率的な HTTP/2 を介した Web サイトのクロールに徐々に切り替えることを計画しています。この変更は徐々に行われ、Googlebot は最初に h2 上の少数のサイトをクロールし、その後、最初にサポートされていた機能の恩恵を受ける可能性のあるサイトを徐々に増やしていきます。 Googlebot は、サイトが h2 をサポートしているかどうか、およびサイトと Googlebot が HTTP/2 を介してクロールすることでメリットがあるかどうかに基づいて、h2 を介してクロールするサイトを決定します。サーバーがまだ HTTP/1.1 のみを使用している場合でも問題ありません。このプロトコルをクロールする明らかな欠点はありません。

Google は、HTTP/2 をサポートするために Googlebot クローラーをアップグレードしています。この変更により、インデックス作成に悪影響を与えることなく、クロールの速度と効率が向上します。ただし、一部のサイト所有者は、この変更をオプトアウトすることを希望する場合があります。サイトは、Googlebot が h2.これが不可能な場合、サイトの所有者は Googlebot チームにメッセージを送信できます (ただし、この解決策は一時的なものです)。

詳細と質問への回答については、Google の詳細な投稿 (Twitter やヘルプ フォーラムへのリンクを含む) を参照してください。

Google によると、Googlebot が h2 をクロールするために使用するソフトウェアは、本番環境で使用できるほど成熟しています。ただし、サーバーをアップグレードするのはウェブサイトの所有者次第だと彼らは言いました. Googlebot は、明らかにメリットがある h2 サイトのクロールのみに切り替えます。明らかなメリットがない場合、Googlebot は引き続き h1 をクロールします。

Cloudflare には、h2 サポートについてサイトをテストするさまざまな方法を含むブログ投稿があります。サイトを h2 にアップグレードするには、サーバー管理者またはホスティング プロバイダーに相談することをお勧めします。サイトの所有者は、サイトと h2 について話し合うように Googlebot を説得することはできません。サイトが h2 をサポートしていて、クロールに適している場合、Googlebot は自動的に切り替えます。そうしないと、Googlebot は引き続き HTTP/1.1 でクロールします。

Google は、サイトに明確なメリットがある場合に限り、HTTP/2 経由でのみサイトをクロールすると発表しました。この変更は、一部のサイトが HTTP/2 を介してクロールするときにほとんどメリットがないことを発見した後に行われました。彼らは引き続きパフォーマンスの向上を評価し、将来的に変換基準を変更する可能性があります。

Search Console に登録されているサイトの所有者は、サイトが HTTP/2 を介したクロールに適している場合、一部のクロール トラフィックが引き続き HTTP/2 を通過する可能性があるというメッセージを受け取ります。サイトはサーバー ログ (たとえば、サイトが Apache で実行されている場合は access.log ファイル) をチェックして、HTTP/2 を介してクロールしているかどうかを確認することもできます。

Googlebot は、HTTP/2 によって導入された機能のほとんどをサポートしています。サーバー プッシュなど、レンダリングに役立つ可能性がある一部の機能は、まだ評価段階にあります。 Googlebot は現在、プレーン テキストの HTTP/2 (h2c) をサポートしていません。

Google は、クロールに HTTP/2 を使用すると発表しました。これは、多重化と同時実行、ヘッダー圧縮、サーバー プッシュなど、いくつかの利点を持つ HTTP プロトコルの新しいバージョンです。

サーバー プッシュは、まだ有効になっていない機能ですが、まだ評価中です。レンダリングには良いかもしれませんが、Google は現時点で特に何も言いません。

HTTP/2 経由でクロールできるようにするには、Web サイトが HTTPS を使用し、HTTP/2 をサポートしている必要があります。これは、最新のブラウザーがそれを処理する方法と同等です。サーバーが TLS ハンドシェイク中に h2 以外のプロトコル バージョンで応答した場合、Googlebot は終了し、後で HTTP/1.1 に戻ります。

h2 の機能とスクレイピングについて詳しく知りたい場合は、Twitter で Google に質問できます。 h2 の主な利点は、サーバー側と Googlebot 側のリソースを節約できることです。 Googlebot が h1 を使用してクロールするか h2 を使用してクロールするかは、サイトのインデックス作成方法に影響しないため、Google がサイトからクロールする予定の量に影響しません。 h2 でクロールされたサイトにはランキング上の利点はありません。

新しい Robots.txt オープン ソース プロジェクト。
昨年、Google は robots.txt パーサーとマッチャー をオープンソースの世界にリリースしました。それ以来、人々はそれを使用して新しいツールを構築し、オープンソース ライブラリに貢献し、新しい言語バージョン (golang など) をリリースしています{rel= "nofollow "} と 錆)。 Google のインターン シーズンが終わりを迎えるにあたり、Go...
続きを読む