- 2023年12月19日: Googleが、スパムポリシーとランキングシステムガイドにおいて、非合意の露骨な画像が高い割合を占めるサイトをどのように扱うかについて、さらに明確にしました。
Google 検索ランキングシステムのガイド
Google は、検索インデックス内の数千億のウェブページやその他のコンテンツに関する多くの要因や信号を考慮し、最も関連性が高く有用な結果を瞬時に提示する自動ランキングシステムを使用しています。
私たちは、厳格なテストと評価を通じてこれらのシステムを定期的に改善し、コンテンツクリエイターやその他の人々に役立つ可能性のあるランキングシステムの更新を通知します。
このページは、私たちのより注目すべきランキングシステムのいくつかを理解するためのガイドです。これは、クエリに応じて検索結果を生成する基盤技術であるコアランキングシステムの一部であるいくつかのシステムをカバーしています。また、特定のランキングニーズに関連するシステムについても説明しています。
また、私たちの「検索の仕組み」サイトを訪れて、ランキングシステムと他のプロセスがどのように連携してGoogle 検索が世界の情報を整理し、普遍的にアクセス可能で有用にするという使命を達成するかを理解することができます。
BERT
Bidirectional Encoder Representations from Transformers (BERT) は、Google が使用する AI システムで、言葉の組み合わせが異なる意味や意図をどのように表現するかを理解することを可能にします。
危機情報システム
Google は、個人的な危機状況、自然災害、またはその他の広範な危機状況の際に役立つタイムリーな情報を提供するシステムを開発しました:
- 個人的な危機: 私たちのシステムは、人々が自殺、性的暴力、毒物摂取、性別に基づく暴力、または薬物依存に関連する特定のクエリに関して、ホットラインや信頼できる組織のコンテンツを表示する情報を求めているときに理解するように機能します。Google 検索での個人的な危機情報の表示方法についての詳細を学びましょう。
- SOS アラート: 自然災害や広範な危機状況の際、私たちの SOS アラートシステムは、地元、国、または国際当局からの更新を表示するために機能します。これらの更新には、緊急電話番号やウェブサイト、地図、便利なフレーズの翻訳、寄付の機会などが含まれることがあります。SOS アラートがどのように機能するか、そして洪水、森林火災、地震、ハリケーンなどの災害の際にどのように役立つかについてさらに学びましょう。
重複排除システム
Google での検索は、何千もの、さらには何百万もの一致するウェブページを見つけることがあります。その中には非常に似たものもあるかもしれません。そのような場合、私たちのシステムは不必要な重複を避けるために、最も関連性の高い結果のみを表示します。重複排除がどのように機能するか、重複排除が行われたときに省略された結果を見る方法についてさらに学びましょう。
重複排除は、フィーチャードスニペットにも適用されます。ウェブページのリストがフィーチャードスニペットとして昇格した場合、結果の最初のページでリストを繰り返すことはありません。これにより、結果が整理され、人々が関連情報をより簡単に見つけられるようになります。
完全一致ドメインシステム
私たちのランキングシステムは、ドメイン名の単語を検索に関連するコンテンツかどうかを判断する多くの要因の一つとして考慮します。しかし、完全一致ドメインシステムは、特定のクエリに正確に一致するように設計されたドメインにホストされているコンテンツに過剰に評価を与えないように機能します。たとえば、誰かが「best-places-to-eat-lunch」という単語を含むドメイン名を作成し、ドメイン名内のすべての単語がコンテンツを高いランキングに押し上げることを望んでいる場合があります。私たちのシステムはこれに調整します。
新鮮さシステム
私たちは、期待されるクエリに対して新鮮なコンテンツを表示するために設計されたさまざまな「クエリは新鮮さに値する」システムを持っています。たとえば、映画が公開されたばかりの人がその映画について検索している場合、彼らはおそらく制作が始まったときの古い記事ではなく、最近のレビューを求めているでしょう。別の例として、通常、「地震」を検索すると準備や資源に関する資料が表示されるかもしれません。しかし、最近地震が発生した場合、ニュース記事や新鮮なコンテンツが表示されるかもしれません。
役立つコンテンツシステム
私たちの役立つコンテンツシステムは、検索結果において、検索エンジンのトラフィックを得ることを主な目的としたコンテンツではなく、人々のために書かれたオリジナルの役立つコンテンツが見られるようにするために設計されています。
リンク分析システムと PageRank
私たちは、ページ同士がどのようにリンクしているかを理解し、クエリに対してどのページがどれほど役立つかを判断するためのさまざまなシステムを持っています。これらの中には、Google が最初に立ち上げたときに使用されるコアランキングシステムの一つである PageRank が含まれています。興味がある方は、元の PageRank 研究論文や特許を読むことで、さらに学ぶことができます。PageRank の動作はその後大きく進化し、現在もコアランキングシステムの一部であり続けています。
ローカルニュースシステム
私たちは、関連性があるときにローカルなニュースソースを特定し、浮き彫りにするためのシステムを持っています。たとえば、「トップストーリー」や「ローカルニュース」機能を通じてです。
MUM
マルチタスク統一モデル (MUM) は、言語を理解し生成する能力を持つ AI システムです。現在は一般的なランキングには使用されていませんが、特定のアプリケーション、たとえば COVID-19 ワクチン情報の検索改善や、表示されるフィーチャードスニペットの呼び出しを改善するために使用されています。
ニューラルマッチング
ニューラルマッチングは、Google がクエリとページ内の概念の表現を理解し、それらを互いにマッチングさせるために使用する AI システムです。
オリジナルコンテンツシステム
私たちは、オリジナルの報道を含むオリジナルコンテンツが検索結果に目立って表示されるようにするためのシステムを持っています。これにより、単に引用するだけのコンテンツよりも前に出てきます。これは、ページが複数の場所に複製された場合に、プライマリページが何であるかをよりよく理解するのに役立つ特別なカノニカルマークアップのサポートを含みます。
削除ベースの降格システム
Google には、特定の種類のコンテンツを削除することを許可するポリシーがあります。特定のサイトに関連する大量の削除を処理した場合、それをシグナルとして結果を改善するために使用します。特に次のような場合です:
- 法的削除: 特定のサイトに関連する大量の有効な著作権削除リクエストを受け取った場合、それを使用して私たちの結果からそのサイトの他のコンテンツを降格させることができます。この方法で、他の侵害コンテンツがあった場合でも、人々が元のコンテンツと出会う可能性は低くなります。名誉毀損、偽造商品、裁判所の命令による削除に関する苦情にも同様の降格信号を適用します。児童性的虐待資料 (CSAM) の場合、特定された場合は常にそのコンテンツを削除し、CSAM コンテンツの割合が高いサイトからのすべてのコンテンツを降格します。
- 個人情報の削除: 削除の実践が搾取的なサイトに関連する大量の個人情報削除を処理した場合、私たちは結果からそのサイトの他のコンテンツを降格させます。同様の行動パターンが他のサイトで発生しているかどうかも確認し、そうであれば、それらのサイトのコンテンツにも降格を適用します。ドキシングコンテンツの削除や非合意の露骨な画像の削除を受けたサイトにも同様の降格プラクティスを適用する場合があります。
パッセージランキングシステム
パッセージランキングは、検索に対するページの関連性をよりよく理解するために、ウェブページの個々のセクションや「パッセージ」を特定するために使用する AI システムです。
RankBrain
RankBrain は、単語が概念にどのように関連しているかを理解するのを助ける AI システムです。これにより、検索で使用されるすべての正確な単語が含まれていなくても、関連性のあるコンテンツをより適切に返すことができます。コンテンツが他の単語や概念に関連していることを理解するからです。
信頼できる情報システム
複数のシステムがさまざまな方法で、最も信頼できる情報を表示するために機能しています。たとえば、より権威のあるページを表示し、低品質のコンテンツを降格させ、質の高いジャーナリズムを高めることなどです。信頼できる情報が不足している場合、私たちのシステムは自動的に、急速に変化するトピックに関するコンテンツのアドバイザリーや、検索結果の全体的な品質に高い自信がない場合のアドバイザリーを表示します。これにより、より有用な結果をもたらす方法で検索するためのヒントを提供します。検索における高品質情報提供へのアプローチについて、さらに学びましょう。
レビューシステム
レビューシステムは、高品質なレビュー、洞察に満ちた分析とオリジナルリサーチを提供し、そのトピックをよく知っている専門家や愛好者によって書かれたコンテンツをより良く報酬することを目的としています。
サイトの多様性システム
私たちのサイトの多様性システムは、一般的に同じサイトからのウェブページリストをトップ結果に 2 つ以上表示しないように機能します。これにより、特定のサイトがすべてのトップ結果を支配することを防ぎます。ただし、特定の検索に対して特に関連性が高いと判断された場合、2 つ以上のリストを表示する場合もあります。サイトの多様性は、サブドメインをルートドメインの一部として扱います。たとえば、サブドメイン (subdomain.example.com) とルートドメイン (example.com) のリストは、すべて同じ単一のサイトからのものと見なされます。ただし、関連性があると見なされる場合、サブドメインは多様性の目的で別のサイトとして扱われることがあります。
スパム検出システム
誰もスパムでメールボックスをいっぱいにされたくはないので、スパムフィルターは非常に役立ちます。検索も同様の課題に直面しています。インターネットには膨大な量のスパムが含まれており、適切に対処しなければ、最も役立つ関連結果を表示できなくなります。私たちは、SpamBrain を含むさまざまなスパム検出システムを使用して、スパムポリシーに違反するコンテンツや行動に対処しています。これらのシステムは、スパムの脅威の進化に合わせて常に更新されています。
退職したシステム
以下のシステムは歴史的目的のために記載されています。これらは、後継システムに組み込まれたり、コアランキングシステムの一部となったりしています。
- ハミングバード: これは、2013 年 8 月に行われた全体的なランキングシステムへの大きな改善でした。それ以来、私たちのランキングシステムは進化し続けています。
- パンダシステム: これは、私たちの検索結果に高品質でオリジナルのコンテンツが表示されるように設計されたシステムです。2011 年に発表され、「パンダ」というニックネームが付けられ、2015 年にコアランキングシステムの一部となりました。
- ペンギンシステム: これは、リンクスパムと戦うために設計されたシステムです。2012 年に発表され、「ペンギン アップデート」というニックネームが付けられ、2016 年にコアランキングシステムに統合されました。
Recent Comments