Alien Road Company

Google SEO Update 2023 October 17

  • 17 октября: Добавлено напоминание о необходимости указания часового пояса в структурированных данных статьи и уточнено, что произойдет, если часовой пояс не будет предоставлен. Добавлено упоминание о часовом поясе Googlebot, который соответствует Тихоокеанскому времени (PST).

Структурированные данные для статей (Article, NewsArticle, BlogPosting)

Добавление структурированных данных статьи на ваши страницы новостей, блогов и спортивных статей может помочь Google лучше понять содержание веб-страницы и отображать более качественный текст заголовка, изображения и информацию о дате для статьи в результатах поиска Google и других сервисах (например, Google Новости и Google Assistant). Хотя для того, чтобы иметь право на функции Google Новости, такие как «Главные истории», нет обязательного требования к разметке, вы можете добавить данные статьи, чтобы более явно сообщить Google о том, о чем ваш контент (например, что это новостная статья, кто автор или каков заголовок статьи).

Article rich result

Пример

Вот пример страницы со структурированными данными статьи.

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

Как добавить структурированные данные

Структурированные данные — это стандартизированный формат для предоставления информации о странице и классификации содержимого страницы. Если вы новичок в структурированных данных, вы можете узнать больше о том, как они работают.

Вот обзор того, как создавать, тестировать и публиковать структурированные данные. Для пошагового руководства по добавлению структурированных данных на веб-страницу ознакомьтесь с codelab по структурированным данным.

Добавьте как можно больше рекомендуемых свойств, которые применимы к вашей веб-странице. Обязательных свойств нет; вместо этого добавьте свойства, которые относятся к вашему контенту. В зависимости от используемого вами формата узнайте, куда вставить структурированные данные на странице.

Используете CMS? Возможно, будет проще использовать плагин, который интегрирован в вашу CMS. Используете JavaScript? Узнайте, как генерировать структурированные данные с помощью JavaScript. Следуйте рекомендациям. Проверьте ваш код с помощью теста на богатые результаты и исправьте любые критические ошибки. Также рассмотрите возможность исправления любых некритических проблем, которые могут быть отмечены в инструменте, так как это может помочь улучшить качество ваших структурированных данных (однако это не обязательно для получения права на богатые результаты). Разверните несколько страниц, которые содержат ваши структурированные данные, и используйте инструмент инспекции URL, чтобы протестировать, как Google видит страницу. Убедитесь, что ваша страница доступна для Google и не заблокирована файлом robots.txt, тегом noindex или требованиями к входу. Если страница выглядит нормально, вы можете попросить Google повторно проиндексировать ваши URL.

Примечание: Позвольте время для повторного обхода и переиндексации. Помните, что Google может занять несколько дней после публикации страницы, чтобы найти и проиндексировать ее. Чтобы держать Google в курсе будущих изменений, мы рекомендуем вам отправить карту сайта. Вы можете автоматизировать это с помощью API карты сайта Search Console. Руководящие принципы

Вы должны следовать этим рекомендациям, чтобы сделать структурированные данные подходящими для включения в результаты поиска Google.

Предупреждение: Если ваш сайт нарушает одно или несколько из этих руководств, Google может предпринять против него ручные меры. Как только вы устранили проблему, вы можете отправить свой сайт на повторное рассмотрение. Основы поиска Общие рекомендации по структурированным данным Технические рекомендации Технические рекомендации Для многочастных статей убедитесь, что rel=canonical указывает на каждую отдельную страницу или страницу «посмотреть все» (а не на страницу 1 многочастной серии). Узнайте больше о канонизации. Если вы предлагаете доступ к контенту вашего веб-сайта на основе подписки или если пользователи должны зарегистрироваться для доступа, рассмотрите возможность добавления структурированных данных для подписного и платного контента. Определения типов структурированных данных

Чтобы помочь Google лучше понять вашу страницу, включите как можно больше рекомендуемых свойств, которые применимы к вашей веб-странице. Обязательных свойств нет; вместо этого добавьте свойства, которые относятся к вашему контенту.

Объекты статьи

Объекты статьи должны основываться на одном из следующих типов schema.org: Article, NewsArticle, BlogPosting.

Поддерживаемые Google свойства следующие:

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an «about me» page, or a bio page.

If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.

Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

Лучшие практики разметки авторов

Чтобы помочь Google лучше понять и представить автора контента, мы рекомендуем следовать этим лучшим практикам при указании авторов в разметке:

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like «posted by»).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

Вот пример, который соответствует лучшим практикам разметки авторов:

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

Устранение неполадок

Если у вас возникли проблемы с реализацией или отладкой структурированных данных, вот несколько ресурсов, которые могут помочь вам.

Если вы используете систему управления контентом (CMS) или кто-то другой управляет вашим сайтом, попросите их помочь вам. Обязательно перенаправьте любое сообщение из Search Console, которое описывает проблему, им. Google не гарантирует, что функции, использующие структурированные данные, появятся в результатах поиска. Для получения списка распространенных причин, по которым Google может не показывать ваш контент в виде расширенного результата, ознакомьтесь с Общими руководящими принципами структурированных данных. Возможно, у вас есть ошибка в ваших структурированных данных. Проверьте список ошибок структурированных данных. Если на вашу страницу было наложено ручное действие за нарушения структурированных данных, структурированные данные на странице будут игнорироваться (хотя страница все равно может появляться в результатах поиска Google). Для устранения проблем со структурированными данными используйте отчет о ручных действиях. Снова проверьте руководящие принципы, чтобы выяснить, соответствует ли ваш контент требованиям. Проблема может быть вызвана как спамным контентом, так и спамным использованием разметки. Однако проблема может не быть связана с синтаксисом, и, следовательно, Тест расширенных результатов не сможет выявить эти проблемы. Устраните неполадки с отсутствующими расширенными результатами / снижением общего числа расширенных результатов. Позвольте время для повторного обхода и переиндексации. Помните, что может потребоваться несколько дней после публикации страницы, чтобы Google нашел и проиндексировал ее. Для получения общих вопросов о сканировании и индексации ознакомьтесь с Часто задаваемыми вопросами по сканированию и индексации Google Search. Задайте вопрос на форуме Google Search Central.


Googlebot

Googlebot — это общее название для двух типов веб-сканеров Google:

Googlebot Desktop: десктопный сканер, который имитирует пользователя на настольном компьютере.
Googlebot Smartphone: мобильный сканер, который имитирует пользователя на мобильном устройстве.

Вы можете определить подтип Googlebot, взглянув на строку пользовательского агента в запросе. Однако оба типа сканеров подчиняются одному и тому же токену продукта (токену пользовательского агента) в robots.txt, поэтому вы не можете выборочно нацеливаться на Googlebot Smartphone или Googlebot Desktop с помощью robots.txt.

Для большинства сайтов Google в первую очередь индексирует мобильную версию контента. Таким образом, большинство запросов Googlebot на сканирование будет осуществляться с помощью мобильного сканера, а меньшинство — с помощью десктопного.

Как Googlebot получает доступ к вашему сайту

Для большинства сайтов Googlebot не должен получать доступ к вашему сайту более одного раза каждые несколько секунд в среднем. Однако из-за задержек скорость может казаться несколько выше в течение коротких периодов.

Googlebot был разработан для одновременной работы на тысячах машин, чтобы улучшить производительность и масштабируемость по мере роста веба. Кроме того, чтобы сократить использование пропускной способности, мы запускаем множество сканеров на машинах, расположенных рядом с сайтами, которые они могут сканировать. Поэтому ваши журналы могут показывать посещения с нескольких IP-адресов, все с агентом пользователя Googlebot. Наша цель — сканировать как можно больше страниц вашего сайта при каждом посещении, не перегружая ваш сервер. Если вашему сайту трудно справляться с запросами на сканирование от Google, вы можете уменьшить скорость сканирования.

Googlebot в первую очередь сканирует с IP-адресов в Соединенных Штатах. Если Googlebot обнаруживает, что сайт блокирует запросы из Соединенных Штатов, он может попытаться сканировать с IP-адресов, расположенных в других странах. Список текущих используемых блоков IP-адресов Googlebot доступен в формате JSON.

Googlebot сканирует по протоколу HTTP/1.1 и, если это поддерживается сайтом, по протоколу HTTP/2. Нет преимущества в ранжировании в зависимости от того, какая версия протокола используется для сканирования вашего сайта; однако сканирование по протоколу HTTP/2 может сэкономить вычислительные ресурсы (например, ЦП, ОЗУ) для вашего сайта и Googlebot. Чтобы отказаться от сканирования по протоколу HTTP/2, укажите серверу, на котором размещен ваш сайт, отвечать кодом состояния HTTP 421, когда Googlebot пытается сканировать ваш сайт по HTTP/2. Если это невозможно, вы можете отправить сообщение команде Googlebot (однако это решение временное).

Googlebot может сканировать первые 15 МБ HTML-файла или поддерживаемого текстового файла. Каждый ресурс, на который ссылается HTML, например CSS и JavaScript, загружается отдельно, и каждый запрос подчиняется тому же ограничению размера файла. После первых 15 МБ файла Googlebot останавливает сканирование и учитывает только первые 15 МБ файла для индексации. Ограничение размера файла применяется к несжатым данным. У других сканеров Google, например Googlebot Video и Googlebot Image, могут быть другие ограничения.

При сканировании с IP-адресов в США часовой пояс Googlebot — Тихоокеанское время.

Блокировка Googlebot от посещения вашего сайта

Практически невозможно сохранить веб-сервер в секрете, не публикуя ссылки на него. Например, как только кто-то переходит по ссылке с вашего «секретного» сервера на другой веб-сервер, ваш «секретный» URL может появиться в заголовке реферера и быть сохранен и опубликован другим веб-сервером в его журнале рефереров. Аналогично, в сети много устаревших и битых ссылок. Каждый раз, когда кто-то публикует неправильную ссылку на ваш сайт или не обновляет ссылки, чтобы отразить изменения на вашем сервере, Googlebot попытается сканировать неправильную ссылку на вашем сайте.

Если вы хотите предотвратить сканирование контента на вашем сайте Googlebot, у вас есть несколько вариантов. Имейте в виду разницу между тем, чтобы запретить Googlebot сканировать страницу, запретить Googlebot индексировать страницу и сделать страницу недоступной как для сканеров, так и для пользователей.

Проверка Googlebot

Прежде чем решите заблокировать Googlebot, учтите, что строка пользовательского агента, используемая Googlebot, часто подделывается другими сканерами. Важно проверить, действительно ли проблемный запрос исходит от Google. Лучший способ проверить, действительно ли запрос исходит от Googlebot, — использовать обратный DNS-запрос на исходный IP-адрес запроса или сопоставить исходный IP с диапазонами IP-адресов Googlebot.