Alien Road Company

Google SEO Update 2023 October 17

  • 0 Comments
  • 17 octobre : Ajout d’un rappel pour fournir le fuseau horaire dans les données structurées de l’article et clarification de ce qui se passe si un fuseau horaire n’est pas fourni.
    Ajout d’une mention concernant le fuseau horaire de Googlebot, qui est PST.

Données structurées d’article (Article, NewsArticle, BlogPosting)

Ajouter des données structurées d’article à vos pages de nouvelles, de blog et d’articles sportifs peut aider Google à mieux comprendre la page web et à afficher un meilleur texte de titre, des images et des informations de date pour l’article dans les résultats de recherche Google et sur d’autres propriétés (par exemple, Google Actualités et Google Assistant). Bien qu’il n’y ait pas d’exigence de balisage pour être éligible aux fonctionnalités de Google Actualités, telles que les histoires à la une, vous pouvez ajouter l’article pour informer de manière plus explicite Google sur le contenu (par exemple, qu’il s’agit d’un article d’actualité, qui est l’auteur ou quel est le titre de l’article).

Exemplo

Aqui está um exemplo de uma página com dados estruturados de Artigo.

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

Como adicionar dados estruturados

Dados estruturados são um formato padronizado para fornecer informações sobre uma página e classificar o conteúdo da página. Se você é novo em dados estruturados, pode aprender mais sobre como os dados estruturados funcionam.

Aqui está uma visão geral de como construir, testar e lançar dados estruturados. Para um guia passo a passo sobre como adicionar dados estruturados a uma página da web, confira o codelab de dados estruturados.

Adicione o máximo de propriedades recomendadas que se aplicam à sua página da web. Não há propriedades obrigatórias; em vez disso, adicione as propriedades que se aplicam ao seu conteúdo. Com base no formato que você está usando, aprenda onde inserir os dados estruturados na página.

Usando um CMS? Pode ser mais fácil usar um plugin que esteja integrado ao seu CMS.
Usando JavaScript? Aprenda como gerar dados estruturados com JavaScript.
Siga as diretrizes.
Valide seu código usando o Teste de Resultados Ricos e corrija quaisquer erros críticos. Considere também corrigir quaisquer problemas não críticos que possam ser sinalizados na ferramenta, pois eles podem ajudar a melhorar a qualidade dos seus dados estruturados (no entanto, isso não é necessário para ser elegível para resultados ricos).
Implante algumas páginas que incluam seus dados estruturados e use a ferramenta de Inspeção de URL para testar como o Google vê a página. Certifique-se de que sua página esteja acessível ao Google e não esteja bloqueada por um arquivo robots.txt, pela tag noindex ou por requisitos de login. Se a página parecer boa, você pode pedir ao Google para reindexar suas URLs.

Nota: Permita tempo para re-crawl e reindexação. Lembre-se de que pode levar vários dias após a publicação de uma página para o Google encontrá-la e indexá-la.
Para manter o Google informado sobre futuras alterações, recomendamos que você envie um sitemap. Você pode automatizar isso com a API de Sitemap do Search Console.

Diretrizes

Você deve seguir estas diretrizes para habilitar os dados estruturados a serem elegíveis para inclusão nos resultados de pesquisa do Google.

Aviso: Se seu site violar uma ou mais dessas diretrizes, o Google pode tomar uma ação manual contra ele. Depois de corrigir o problema, você pode enviar seu site para reconsideração.
Essenciais para Pesquisa
Diretrizes gerais de dados estruturados
Diretrizes técnicas

Diretrizes técnicas
Para artigos em várias partes, certifique-se de que o rel=canonical aponte para cada página individual ou uma página “ver tudo” (e não para a página 1 de uma série em várias partes). Saiba mais sobre canonização.
Se você oferecer acesso baseado em assinatura ao conteúdo do seu site, ou se os usuários precisarem se registrar para obter acesso, considere adicionar dados estruturados para conteúdo de assinatura e pago.

Definições de tipos de dados estruturados

Para ajudar o Google a entender melhor sua página, inclua o máximo de propriedades recomendadas que se aplicam à sua página da web. Não há propriedades obrigatórias; em vez disso, adicione as propriedades que se aplicam ao seu conteúdo.

Objetos de Artigo

Os objetos de Artigo devem ser baseados em um dos seguintes tipos do schema.org: Article, NewsArticle, BlogPosting.

As propriedades suportadas pelo Google são as seguintes:

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an “about me” page, or a bio page.If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.
datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.
headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

Meilleures pratiques de balisage pour les auteurs

Pour aider Google à mieux comprendre et représenter l’auteur du contenu, nous vous recommandons de suivre ces meilleures pratiques lors de la spécification des auteurs dans le balisage :

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like “posted by”).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

Voici un exemple qui applique les meilleures pratiques de balisage pour les auteurs :

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

Dépannage

Si vous rencontrez des problèmes pour mettre en œuvre ou déboguer des données structurées, voici quelques ressources qui peuvent vous aider.

Si vous utilisez un système de gestion de contenu (CMS) ou si quelqu’un d’autre s’occupe de votre site, demandez-lui de vous aider. Assurez-vous de lui transmettre tout message de la Search Console qui détaille le problème. Google ne garantit pas que les fonctionnalités utilisant des données structurées apparaîtront dans les résultats de recherche. Pour une liste des raisons courantes pour lesquelles Google peut ne pas afficher votre contenu dans un résultat enrichi, consultez les Directives générales sur les données structurées. Vous pourriez avoir une erreur dans vos données structurées. Consultez la liste des erreurs de données structurées. Si vous avez reçu une action manuelle concernant vos données structurées sur votre page, les données structurées sur cette page seront ignorées (bien que la page puisse toujours apparaître dans les résultats de recherche Google). Pour résoudre les problèmes de données structurées, utilisez le rapport sur les actions manuelles. Revoyez les directives pour vérifier si votre contenu est conforme à celles-ci. Le problème peut être causé par un contenu ou un balisage de mauvaise qualité. Cependant, le problème peut ne pas être lié à une erreur de syntaxe, et le Test de résultats enrichis ne pourra donc pas identifier ces problèmes. Résolvez les problèmes de résultats enrichis manquants / chute du total des résultats enrichis. Accordez du temps pour le re-crawling et le réindexage. Rappelez-vous qu’il peut falloir plusieurs jours après la publication d’une page pour que Google la trouve et la parcoure. Pour des questions générales sur le crawling et l’indexation, consultez la FAQ sur le crawling et l’indexation de Google Search. Posez une question dans le forum de Google Search Central.


Googlebot

Googlebot est le nom générique désignant les deux types de robots d’exploration de Google :

Googlebot Desktop : un robot d’exploration de bureau qui simule un utilisateur sur un ordinateur de bureau.
Googlebot Smartphone : un robot d’exploration mobile qui simule un utilisateur sur un appareil mobile.

Vous pouvez identifier le sous-type de Googlebot en examinant la chaîne d’agent utilisateur dans la requête. Cependant, les deux types de robots respectent le même jeton de produit (jeton d’agent utilisateur) dans le fichier robots.txt, et vous ne pouvez donc pas cibler sélectivement Googlebot Smartphone ou Googlebot Desktop à l’aide de robots.txt.

Pour la plupart des sites, Google indexe principalement la version mobile du contenu. Ainsi, la majorité des demandes d’exploration de Googlebot seront effectuées à l’aide du robot mobile, et une minorité à l’aide du robot de bureau.

Comment Googlebot accède à votre site

Pour la plupart des sites, Googlebot ne devrait pas accéder à votre site plus d’une fois toutes les quelques secondes en moyenne. Cependant, en raison de délais, il est possible que le taux apparaisse légèrement plus élevé sur de courtes périodes.

Googlebot a été conçu pour fonctionner simultanément sur des milliers de machines afin d’améliorer les performances et de s’adapter à la croissance du web. De plus, pour réduire l’utilisation de la bande passante, nous faisons fonctionner de nombreux robots sur des machines situées près des sites qu’ils pourraient explorer. Par conséquent, vos journaux peuvent montrer des visites provenant de plusieurs adresses IP, toutes avec l’agent utilisateur Googlebot. Notre objectif est d’explorer le plus de pages possible de votre site à chaque visite sans surcharger votre serveur. Si votre site a du mal à suivre les demandes d’exploration de Google, vous pouvez réduire le taux d’exploration.

Googlebot explore principalement depuis des adresses IP situées aux États-Unis. Si Googlebot détecte qu’un site bloque les demandes en provenance des États-Unis, il peut essayer d’explorer à partir d’adresses IP situées dans d’autres pays. La liste des blocs d’adresses IP actuellement utilisés par Googlebot est disponible au format JSON.

Googlebot explore via HTTP/1.1 et, si le site le prend en charge, HTTP/2. Il n’y a aucun avantage de classement basé sur le protocole utilisé pour explorer votre site ; cependant, l’exploration via HTTP/2 peut économiser des ressources informatiques (par exemple, CPU, RAM) pour votre site et Googlebot. Pour ne pas explorer via HTTP/2, demandez au serveur hébergeant votre site de répondre avec un code d’état HTTP 421 lorsque Googlebot tente d’explorer votre site via HTTP/2. Si cela n’est pas possible, vous pouvez envoyer un message à l’équipe Googlebot (cependant, cette solution est temporaire).

Googlebot peut explorer les 15 Mo premiers d’un fichier HTML ou d’un fichier texte pris en charge. Chaque ressource référencée dans l’HTML, comme le CSS et JavaScript, est récupérée séparément, et chaque récupération est soumise à la même limite de taille de fichier. Après les 15 Mo initiaux du fichier, Googlebot cesse d’explorer et ne considère que les premiers 15 Mo du fichier pour l’indexation. La limite de taille de fichier s’applique aux données non compressées. D’autres robots d’exploration de Google, par exemple Googlebot Video et Googlebot Image, peuvent avoir des limites différentes.

Lors de l’exploration depuis des adresses IP aux États-Unis, le fuseau horaire de Googlebot est l’heure du Pacifique.

Bloquer Googlebot de visiter votre site

Il est presque impossible de garder un serveur web secret en ne publiant pas de liens vers celui-ci. Par exemple, dès qu’une personne suit un lien depuis votre serveur “secret” vers un autre serveur web, votre URL “secrète” peut apparaître dans l’étiquette de référence et peut être stockée et publiée par l’autre serveur web dans son journal de référence. De même, le web a de nombreux liens obsolètes et cassés. Chaque fois qu’une personne publie un lien incorrect vers votre site ou omet de mettre à jour les liens pour refléter les changements dans votre serveur, Googlebot tentera d’explorer un lien incorrect de votre site.

Si vous souhaitez empêcher Googlebot d’explorer le contenu de votre site, vous disposez de plusieurs options. Soyez conscient de la différence entre empêcher Googlebot d’explorer une page, empêcher Googlebot d’indexer une page et empêcher une page d’être accessible à la fois par les robots d’exploration ou les utilisateurs.

Vérifier Googlebot

Avant de décider de bloquer Googlebot, sachez que la chaîne d’agent utilisateur utilisée par Googlebot est souvent falsifiée par d’autres robots d’exploration. Il est important de vérifier qu’une demande problématique provient réellement de Google. Le meilleur moyen de vérifier qu’une demande provient bien de Googlebot est d’utiliser une recherche DNS inversée sur l’IP source de la demande ou de faire correspondre l’IP source avec les plages d’IP de Googlebot.