Alien Road Company

Google SEO Update 2023 December 19

  • 0 Comments
  • 19 декабря: Дополнительно уточнено, как Google обрабатывает сайты с высоким процентом несогласованного откровенного контента в наших политиках по борьбе со спамом и руководстве по системам ранжирования.

Руководство по системам ранжирования Google Search

Google использует автоматизированные системы ранжирования, которые рассматривают множество факторов и сигналов о сотнях миллиардов веб-страниц и другого контента в нашем индексе поиска, чтобы представить наиболее релевантные и полезные результаты всего за доли секунды.

Мы регулярно улучшаем эти системы с помощью строгого тестирования и оценки и уведомляем о обновлениях наших систем ранжирования, когда это может быть полезно создателям контента и другим.

Эта страница является руководством для понимания некоторых из наших более заметных систем ранжирования. В ней рассматриваются некоторые системы, которые являются частью наших основных систем ранжирования, которые представляют собой основные технологии, генерирующие результаты поиска в ответ на запросы. Также рассматриваются некоторые системы, связанные с конкретными потребностями ранжирования.

Вы также можете посетить наш сайт Как работает поиск чтобы понять, как наши системы ранжирования, в сочетании с другими процессами, работают вместе, чтобы Google Search выполнял нашу миссию по организации информации в мире и сделанию ее универсально доступной и полезной.

BERT

Bidirectional Encoder Representations from Transformers (BERT) — это ИИ-система, которую использует Google и которая позволяет нам понимать, как комбинации слов выражают различные значения и намерения.

Системы информации о кризисах

Google разработал системы для предоставления полезной и своевременной информации в периоды кризиса, будь то личные кризисные ситуации, стихийные бедствия или другие широко распространенные кризисные ситуации:

  • Личные кризисы: Наши системы работают над пониманием того, когда люди ищут информацию о личных кризисных ситуациях, чтобы отобразить горячие линии и контент от доверенных организаций для определенных запросов, связанных с самоубийством, сексуальным насилием, отравлением, гендерным насилием или зависимостью от наркотиков. Узнайте больше о том, как информация о личных кризисах отображается в Google Search.
  • SOS Alerts: В периоды стихийных бедствий или широко распространенных кризисных ситуаций наша система SOS Alerts работает над отображением обновлений от местных, национальных или международных властей. Эти обновления могут включать экстренные телефонные номера и веб-сайты, карты, переводы полезных фраз, возможности для пожертвований и многое другое. Узнайте больше о том, как работает SOS Alerts и как они являются частью кризисных оповещений Google, которые помогают в периоды наводнений, лесных пожаров, землетрясений, ураганов и других бедствий.

Системы дедупликации

Поиск в Google может находить тысячи или даже миллионы совпадающих веб-страниц. Некоторые из них могут быть очень похожи друг на друга. В таких случаях наши системы показывают только наиболее релевантные результаты, чтобы избежать бесполезного дублирования. Узнайте больше о том, как работает дедупликация и как увидеть опущенные результаты, если это необходимо.

Дедупликация также происходит с выделенными фрагментами. Если веб-страница повышается до уровня выделенного фрагмента, мы не повторяем эту запись позже на первой странице результатов. Это упрощает результаты и помогает людям легче находить релевантную информацию.

Система точного соответствия доменов

Наши системы ранжирования рассматривают слова в доменных именах как один из многих факторов для определения, является ли контент релевантным для поиска. Однако наша система точного соответствия доменов работает так, чтобы мы не давали слишком много кредитов контенту, размещенному на доменах, созданных для точного соответствия определенным запросам. Например, кто-то может создать доменное имя, содержащее слова «лучшие-места-поесть-обед», в надежде, что все эти слова в доменном имени поднимут контент высоко в ранжировании. Наша система корректирует это.

Системы свежести

У нас есть различные системы «запрос требует свежести», предназначенные для отображения более свежего контента для запросов, где это ожидается. Например, если кто-то ищет информацию о фильме, который только что вышел, он, вероятно, хочет видеть свежие обзоры, а не старые статьи с начала производства. В другом примере, обычно поиск «землетрясение» может вернуть материалы о подготовке и ресурсах. Однако, если землетрясение произошло недавно, то могут появиться новостные статьи и более свежий контент.

Система полезного контента

Наша система полезного контента предназначена для того, чтобы лучше гарантировать, что люди видят оригинальный, полезный контент, написанный людьми для людей, в результатах поиска, а не контент, созданный в первую очередь для получения трафика от поисковых систем.

Системы анализа ссылок и PageRank

У нас есть различные системы, которые понимают, как страницы ссылаются друг на друга как способ определения того, о чем страницы и какие из них могут быть наиболее полезными в ответ на запрос. Среди них — PageRank, одна из наших основных систем ранжирования, используемая при первом запуске Google. Заинтересованные могут узнать больше, прочитав оригинальную исследовательскую статью и патент PageRank. То, как работает PageRank, с тех пор значительно изменилось, и он продолжает быть частью наших основных систем ранжирования.

Системы местных новостей

У нас есть системы, которые работают над идентификацией и выводом на поверхность местных источников новостей, когда это актуально, например, через наши функции «Главные новости» и «Местные новости».

MUM

Multitask Unified Model (MUM) — это ИИ-система, способная как понимать, так и генерировать язык. Она в настоящее время не используется для общего ранжирования в Поиске, а скорее для некоторых специфических приложений, таких как улучшение поиска информации о вакцинах против COVID-19 и улучшение выделенных фрагментов, которые мы отображаем.

Нейронное соответствие

Нейронное соответствие — это ИИ-система, которую Google использует для понимания представлений концепций в запросах и страницах и их сопоставления друг с другом.

Системы оригинального контента

У нас есть системы, которые помогают гарантировать, что мы показываем оригинальный контент на видном месте в результатах поиска, включая оригинальные репортажи, перед теми, кто просто ссылается на него. Это включает поддержку специальной канонической разметки, которую авторы могут использовать, чтобы помочь нам лучше понять, какая страница является основной, если страница была дублирована в нескольких местах.

Системы демоции на основе удаления

У Google есть политики, которые позволяют удалять определенные типы контента. Если мы обрабатываем большой объем таких удалений, касающихся конкретного сайта, мы используем это как сигнал для улучшения наших результатов. В частности:

  • Юридические удаления: Когда мы получаем большое количество действительных запросов на удаление авторских прав, касающихся данного сайта, мы можем использовать это, чтобы понизить другие материалы с этого сайта в наших результатах. Таким образом, если есть другой нарушающий контент, люди с меньшей вероятностью столкнутся с ним по сравнению с оригинальным контентом. Мы применяем аналогичные сигналы понижения к жалобам, связанным с клеветой, контрафактными товарами и судебными удалениями. В случае материалов о сексуальном насилии в отношении детей (CSAM) мы всегда удаляем такой контент, когда он идентифицирован, и мы понижаем весь контент с сайтов с высоким процентом контента CSAM.
  • Удаления личной информации: Если мы обрабатываем большой объем удалений личной информации, касающихся сайта с эксплуататорскими практиками удаления, мы понижаем другой контент с этого сайта в наших результатах. Мы также смотрим, происходит ли тот же шаблон поведения с другими сайтами, и, если да, применяем понижения к контенту на этих сайтах. Мы можем применять аналогичные практики понижения для сайтов, получающих большой объем удалений контента о доxxинге или удалений несанкционированных откровенных изображений.

Система ранжирования отрывков

Система ранжирования отрывков — это ИИ-система, которую мы используем для идентификации отдельных секций или «отрывков» веб-страницы, чтобы лучше понять, насколько страница релевантна запросу.

RankBrain

RankBrain — это ИИ-система, которая помогает нам понять, как слова связаны с концепциями. Это означает, что мы можем лучше возвращать релевантный контент, даже если он не содержит всех точных слов, использованных в запросе, понимая, что контент связан с другими словами и концепциями.

Системы надежной информации

Несколько систем работают различными способами, чтобы показать наиболее надежную информацию, такую как помощь в выявлении более авторитетных страниц и понижение качества низкокачественного контента и повышение качества журналистики. В случаях, когда надежная информация может отсутствовать, наши системы автоматически отображают советы по контенту о быстро меняющихся темах или когда наши системы не уверены в общей качестве доступных результатов поиска. Они предоставляют советы о том, как искать так, чтобы привести к более полезным результатам. Узнайте больше о нашем подходе к предоставлению качественной информации в Поиске.

Система отзывов

Система отзывов направлена на то, чтобы лучше вознаграждать высококачественные отзывы, контент, который предоставляет глубокий анализ и оригинальные исследования и написан экспертами или энтузиастами, хорошо знающими тему.

Система разнообразия сайтов

Наша система разнообразия сайтов работает так, чтобы мы, как правило, не показывали более двух веб-страниц из одного и того же сайта в наших лучших результатах, чтобы ни один отдельный сайт не доминировал над всеми верхними результатами. Тем не менее, мы все равно можем показать более двух записей в случаях, когда наши системы определяют, что это особенно актуально для конкретного поиска. Разнообразие сайтов в целом рассматривает поддомены как часть корневого домена. Например: записи из поддомена (subdomain.example.com) и корневого домена (example.com) будут считаться частью одного и того же сайта. Тем не менее, иногда поддомены рассматриваются как отдельные сайты для целей разнообразия, когда это считается актуальным.

Системы обнаружения спама

Никто не хочет, чтобы их почтовый ящик был заполнен спамом, поэтому фильтры спама очень полезны. Поиск сталкивается с аналогичной проблемой, потому что в Интернете имеется огромное количество спама, который, если с ним не бороться, не позволит нам показывать наиболее полезные и релевантные результаты. Мы используем ряд систем обнаружения спама, включая SpamBrain, чтобы бороться с контентом и поведением, нарушающим наши политики по борьбе со спамом. Эти системы постоянно обновляются, чтобы успевать за последними способами, которыми эволюционирует угроза спама.

Устаревшие системы

Системы, описанные ниже, указаны в исторических целях. Они либо были включены в преемственные системы, либо стали частью наших основных систем ранжирования.

  • Hummingbird: Это было значительное улучшение наших общих систем ранжирования, произведенное в августе 2013 года. Наши системы ранжирования продолжали развиваться с тех пор, так же как они развивались и до этого.
  • Система Panda: Это была система, предназначенная для обеспечения появления высококачественного и оригинального контента в наших результатах поиска. Объявленная в 2011 году и получившая прозвище «Panda», она эволюционировала и стала частью наших основных систем ранжирования в 2015 году.
  • Система Penguin: Это была система, предназначенная для борьбы с ссылочным спамом. Объявленная в 2012 году и получившая прозвище «Обновление Penguin», она была интегрирована в наши основные системы ранжирования в 2016 году.