Alien Road Company

Google SEO Update 2023 October 17

  • 17 octobre : Ajout d’un rappel pour fournir le fuseau horaire dans les données structurées d’article et clarification de ce qui se passe si un fuseau horaire n’est pas fourni. Mention ajoutée concernant le fuseau horaire de Googlebot, qui est UTC-8.

Données structurées d’article (Article, NewsArticle, BlogPosting)

Ajouter des données structurées d’article à vos pages d’actualités, de blog et d’articles sportifs peut aider Google à mieux comprendre la page web et à afficher un meilleur texte de titre, des images et des informations de date pour l’article dans les résultats de recherche sur Google Search et d’autres propriétés (par exemple, Google News et Google Assistant). Bien qu’il n’y ait pas d’exigence de balisage pour être éligible aux fonctionnalités de Google News comme les Top stories, vous pouvez ajouter Article pour indiquer plus explicitement à Google de quoi parle votre contenu (par exemple, qu’il s’agit d’un article d’actualité, qui est l’auteur ou quel est le titre de l’article).

Article rich result

Exemple

Voici un exemple d’une page avec des données structurées d’article.

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

Comment ajouter des données structurées

Les données structurées sont un format standardisé pour fournir des informations sur une page et classer le contenu de la page. Si vous êtes nouveau dans les données structurées, vous pouvez en apprendre davantage sur le fonctionnement des données structurées.

Voici un aperçu de la façon de créer, tester et publier des données structurées. Pour un guide étape par étape sur la façon d’ajouter des données structurées à une page web, consultez le codelab sur les données structurées.

Ajoutez autant de propriétés recommandées qui s’appliquent à votre page web. Il n’y a pas de propriétés obligatoires ; au lieu de cela, ajoutez les propriétés qui s’appliquent à votre contenu. En fonction du format que vous utilisez, apprenez où insérer les données structurées sur la page.

Vous utilisez un CMS ? Il peut être plus facile d’utiliser un plugin intégré à votre CMS.
Vous utilisez JavaScript ? Apprenez à générer des données structurées avec JavaScript.
Suivez les directives.
Validez votre code en utilisant le Test de Résultats Riches et corrigez les erreurs critiques. Envisagez également de corriger les problèmes non critiques qui peuvent être signalés dans l’outil, car cela peut aider à améliorer la qualité de vos données structurées (cependant, cela n’est pas nécessaire pour être éligible aux résultats enrichis).
Déployez quelques pages qui incluent vos données structurées et utilisez l’outil d’Inspection d’URL pour tester comment Google voit la page. Assurez-vous que votre page est accessible à Google et n’est pas bloquée par un fichier robots.txt, une balise noindex ou des exigences de connexion. Si la page semble correcte, vous pouvez demander à Google de réexplorer vos URLs.

Remarque : Laissez du temps pour le réexploration et la réindexation. N’oubliez pas qu’il peut falloir plusieurs jours après la publication d’une page pour que Google la trouve et l’explore.
Pour tenir Google informé des changements futurs, nous vous recommandons de soumettre un sitemap. Vous pouvez automatiser cela avec l’API Sitemap de la Search Console.

Directives

Vous devez suivre ces directives pour que les données structurées soient éligibles à l’inclusion dans les résultats de recherche de Google.

Avertissement : Si votre site enfreint une ou plusieurs de ces directives, Google peut prendre des mesures manuelles contre lui. Une fois que vous avez corrigé le problème, vous pouvez soumettre votre site pour réexamen.
Essentiels de Recherche
Directives générales sur les données structurées
Directives techniques
Directives techniques
Pour les articles en plusieurs parties, assurez-vous que le rel=canonical pointe vers chaque page individuelle ou vers une page « voir tout » (et non vers la page 1 d’une série en plusieurs parties). En savoir plus sur la canonisation.
Si vous offrez un accès basé sur un abonnement à votre contenu de site web, ou si les utilisateurs doivent s’inscrire pour y accéder, envisagez d’ajouter des données structurées pour le contenu par abonnement et payant.

Définitions des types de données structurées

Pour aider Google à mieux comprendre votre page, incluez autant de propriétés recommandées qui s’appliquent à votre page web. Il n’y a pas de propriétés obligatoires ; au lieu de cela, ajoutez les propriétés qui s’appliquent à votre contenu.

Objets d’article

Les objets d’article doivent être basés sur l’un des types suivants de schema.org : Article, NewsArticle, BlogPosting.

Les propriétés supportées par Google sont les suivantes :

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an « about me » page, or a bio page.

If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.

Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

Meilleures pratiques pour le balisage des auteurs

Pour aider Google à mieux comprendre et représenter l’auteur du contenu, nous recommandons de suivre ces meilleures pratiques lors de la spécification des auteurs dans le balisage :

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like « posted by »).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

Voici un exemple qui applique les meilleures pratiques de balisage pour les auteurs :

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

Dépannage

Si vous avez des problèmes pour mettre en œuvre ou déboguer des données structurées, voici quelques ressources qui pourraient vous aider.

Si vous utilisez un système de gestion de contenu (CMS) ou si quelqu’un d’autre s’occupe de votre site, demandez-lui de vous aider. Assurez-vous de lui transmettre tout message de la Search Console détaillant le problème. Google ne garantit pas que les fonctionnalités qui consomment des données structurées apparaîtront dans les résultats de recherche. Pour une liste des raisons courantes pour lesquelles Google peut ne pas afficher votre contenu dans un résultat enrichi, consultez les Directives générales sur les données structurées. Vous pourriez avoir une erreur dans vos données structurées. Vérifiez la liste des erreurs de données structurées. Si vous avez reçu une action manuelle sur les données structurées concernant votre page, les données structurées de la page seront ignorées (bien que la page puisse toujours apparaître dans les résultats de recherche de Google). Pour corriger les problèmes de données structurées, utilisez le rapport sur les actions manuelles. Revoyez les directives pour vérifier si votre contenu est conforme à celles-ci. Le problème peut être causé par du contenu indésirable ou un usage abusif du balisage. Cependant, le problème ne peut pas être un problème de syntaxe, et le test des résultats enrichis ne pourra pas identifier ces problèmes. Dépannez les résultats enrichis manquants / la baisse du nombre total de résultats enrichis. Laissez du temps pour le nouveau crawl et la nouvelle indexation. N’oubliez pas qu’il peut falloir plusieurs jours après la publication d’une page pour que Google la trouve et la crawl. Pour des questions générales sur le crawling et l’indexation, consultez la FAQ sur le crawling et l’indexation de Google Search. Posez une question dans le forum de Google Search Central.


Googlebot

Googlebot est le nom générique des deux types de robots d’exploration de Google :

Googlebot Bureau : un robot d’exploration de bureau qui simule un utilisateur sur un ordinateur de bureau.
Googlebot Smartphone : un robot d’exploration mobile qui simule un utilisateur sur un appareil mobile.

Vous pouvez identifier le sous-type de Googlebot en regardant la chaîne d’agent utilisateur dans la requête. Cependant, les deux types de robots obéissent au même jeton de produit (jeton d’agent utilisateur) dans le fichier robots.txt, vous ne pouvez donc pas cibler spécifiquement Googlebot Smartphone ou Googlebot Bureau à l’aide de robots.txt.

Pour la plupart des sites, Google indexe principalement la version mobile du contenu. Ainsi, la majorité des demandes de crawl de Googlebot seront effectuées à l’aide du robot mobile, et une minorité à l’aide du robot de bureau.

Comment Googlebot accède à votre site

Pour la plupart des sites, Googlebot ne devrait pas accéder à votre site plus d’une fois toutes les quelques secondes en moyenne. Cependant, en raison des délais, il est possible que le taux apparaisse légèrement plus élevé sur de courtes périodes.

Googlebot a été conçu pour être exécuté simultanément par des milliers de machines afin d’améliorer les performances et d’évoluer à mesure que le web se développe. De plus, pour réduire l’utilisation de la bande passante, nous exécutons de nombreux robots d’exploration sur des machines situées près des sites qu’ils pourraient explorer. Par conséquent, vos journaux peuvent montrer des visites provenant de plusieurs adresses IP, toutes avec l’agent utilisateur Googlebot. Notre objectif est d’explorer autant de pages de votre site que possible à chaque visite sans surcharger votre serveur. Si votre site a du mal à suivre les demandes de crawl de Google, vous pouvez réduire le taux de crawl.

Googlebot explore principalement à partir d’adresses IP situées aux États-Unis. Si Googlebot détecte qu’un site bloque les demandes en provenance des États-Unis, il peut tenter d’explorer à partir d’adresses IP situées dans d’autres pays. La liste des blocs d’adresses IP actuellement utilisés par Googlebot est disponible au format JSON.

Googlebot explore via HTTP/1.1 et, si pris en charge par le site, HTTP/2. Il n’y a pas d’avantage en termes de classement basé sur la version du protocole utilisée pour explorer votre site ; cependant, l’exploration via HTTP/2 peut économiser des ressources informatiques (par exemple, CPU, RAM) pour votre site et Googlebot.
Pour refuser l’exploration via HTTP/2, demandez au serveur hébergeant votre site de répondre avec un code d’état HTTP 421 lorsque Googlebot tente d’explorer votre site via HTTP/2. Si cela n’est pas possible, vous pouvez envoyer un message à l’équipe de Googlebot (cependant, cette solution est temporaire).

Googlebot peut explorer les 15 premiers Mo d’un fichier HTML ou d’un fichier texte pris en charge. Chaque ressource référencée dans le HTML, comme CSS et JavaScript, est récupérée séparément, et chaque récupération est soumise à la même limite de taille de fichier. Après les 15 premiers Mo du fichier, Googlebot cesse d’explorer et ne considère que les 15 premiers Mo du fichier pour l’indexation. La limite de taille de fichier s’applique aux données non compressées. D’autres robots Google, tels que Googlebot Vidéo et Googlebot Image, peuvent avoir des limites différentes.

Lorsqu’il explore à partir d’adresses IP aux États-Unis, le fuseau horaire de Googlebot est le fuseau horaire du Pacifique.

Bloquer Googlebot de visiter votre site

Il est presque impossible de garder un serveur web secret en ne publiant pas de liens vers celui-ci. Par exemple, dès qu’une personne suit un lien depuis votre serveur « secret » vers un autre serveur web, votre URL « secrète » peut apparaître dans la balise référente et peut être stockée et publiée par l’autre serveur web dans son journal référent. De même, le web contient de nombreux liens obsolètes et brisés. Chaque fois que quelqu’un publie un lien incorrect vers votre site ou oublie de mettre à jour les liens pour refléter les changements sur votre serveur, Googlebot essaiera d’explorer un lien incorrect depuis votre site.

Si vous souhaitez empêcher Googlebot d’explorer le contenu de votre site, vous avez plusieurs options. Soyez conscient de la différence entre empêcher Googlebot d’explorer une page, empêcher Googlebot d’indexer une page et empêcher une page d’être accessible à la fois par les robots d’exploration et par les utilisateurs.

Vérifier Googlebot

Avant de décider de bloquer Googlebot, sachez que la chaîne d’agent utilisateur utilisée par Googlebot est souvent imitée par d’autres robots. Il est important de vérifier qu’une demande problématique provient réellement de Google. La meilleure façon de vérifier qu’une demande provient réellement de Googlebot est d’utiliser une recherche DNS inversée sur l’IP source de la demande ou de comparer l’IP source avec les plages d’IP de Googlebot.