Google SEO Update 2023 October 17
- Ata Aytug Acar
- 0 Comments
- 17 octobre : Ajout d’un rappel pour fournir le fuseau horaire dans les données structurées d’article et clarification de ce qui se passe si un fuseau horaire n’est pas fourni. Mention ajoutée concernant le fuseau horaire de Googlebot, qui est UTC-8.
Données structurées d’article (Article, NewsArticle, BlogPosting)
Ajouter des données structurées d’article à vos pages d’actualités, de blog et d’articles sportifs peut aider Google à mieux comprendre la page web et à afficher un meilleur texte de titre, des images et des informations de date pour l’article dans les résultats de recherche sur Google Search et d’autres propriétés (par exemple, Google News et Google Assistant). Bien qu’il n’y ait pas d’exigence de balisage pour être éligible aux fonctionnalités de Google News comme les Top stories, vous pouvez ajouter Article pour indiquer plus explicitement à Google de quoi parle votre contenu (par exemple, qu’il s’agit d’un article d’actualité, qui est l’auteur ou quel est le titre de l’article).
Exemple
Voici un exemple d’une page avec des données structurées d’article.
<html> <head> <title>Title of a News Article</title> <script type="application/ld+json"> { "@context": "https://schema.org", "@type": "NewsArticle", "headline": "Title of a News Article", "image": [ "https://example.com/photos/1x1/photo.jpg", "https://example.com/photos/4x3/photo.jpg", "https://example.com/photos/16x9/photo.jpg" ], "datePublished": "2015-02-05T08:00:00+08:00", "dateModified": "2015-02-05T09:20:00+08:00", "author": [{ "@type": "Person", "name": "Jane Doe", "url": "https://example.com/profile/janedoe123" },{ "@type": "Person", "name": "John Doe", "url": "https://example.com/profile/johndoe123" }] } </script> </head> <body> </body> </html>
Recommended properties | |
---|---|
author |
Person or Organization The author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices. |
author. |
Text The name of the author. |
author. |
URL A link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an « about me » page, or a bio page.
If the URL is an internal profile page, we recommend marking up that author using profile page structured data. |
dateModified |
DateTime The date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.
Add the |
datePublished |
DateTime The date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.
Add the |
headline |
Text The title of the article. Consider using a concise title, as long titles may be truncated on some devices. |
image |
Repeated ImageObject or URL The URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.
Additional image guidelines:
For example: "image": [ "https://example.com/photos/1x1/photo.jpg", "https://example.com/photos/4x3/photo.jpg", "https://example.com/photos/16x9/photo.jpg" ] |
Meilleures pratiques pour le balisage des auteurs
Pour aider Google à mieux comprendre et représenter l’auteur du contenu, nous recommandons de suivre ces meilleures pratiques lors de la spécification des auteurs dans le balisage :
Best practices for author markup | |
---|---|
Include all authors in the markup |
Make sure that all the authors that are presented as authors on the web page are also included in markup. |
Specifying multiple authors |
When specifying multiple authors, list each author in their own author field:
"author": [ {"name": "Willow Lane"}, {"name": "Regula Felix"} ] Don’t merge multiple authors in the same "author": { "name": "Willow Lane, Regula Felix" } |
Use additional fields |
To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs ) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:
"author": [ { "@type": "Person", "name": "Willow Lane", "url": "https://www.example.com/staff/willow_lane" } ] If the author is an organization, you could link to the organization’s home page. "author": [ { "@type":"Organization", "name": "Some News Agency", "url": "https://www.example.com/" } ] |
Only specify the author’s name in the
|
In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:
"author": [ { "name": "Echidna Jones", "honorificPrefix": "Dr", "jobTitle": "Editor in Chief" } ], "publisher": [ { "name": "Bugs Daily" } ] } |
Use the appropriate
|
Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person). |
Voici un exemple qui applique les meilleures pratiques de balisage pour les auteurs :
"author": [ { "@type": "Person", "name": "Willow Lane", "jobTitle": "Journalist", "url": "https://www.example.com/staff/willow-lane" }, { "@type": "Person", "name": "Echidna Jones", "jobTitle": "Editor in Chief", "url": "https://www.example.com/staff/echidna-jones" } ], "publisher": { "name": "The Daily Bug", "url": "https://www.example.com" }, // + Other fields related to the article... }
Dépannage
Si vous avez des problèmes pour mettre en œuvre ou déboguer des données structurées, voici quelques ressources qui pourraient vous aider.
Si vous utilisez un système de gestion de contenu (CMS) ou si quelqu’un d’autre s’occupe de votre site, demandez-lui de vous aider. Assurez-vous de lui transmettre tout message de la Search Console détaillant le problème. Google ne garantit pas que les fonctionnalités qui consomment des données structurées apparaîtront dans les résultats de recherche. Pour une liste des raisons courantes pour lesquelles Google peut ne pas afficher votre contenu dans un résultat enrichi, consultez les Directives générales sur les données structurées. Vous pourriez avoir une erreur dans vos données structurées. Vérifiez la liste des erreurs de données structurées. Si vous avez reçu une action manuelle sur les données structurées concernant votre page, les données structurées de la page seront ignorées (bien que la page puisse toujours apparaître dans les résultats de recherche de Google). Pour corriger les problèmes de données structurées, utilisez le rapport sur les actions manuelles. Revoyez les directives pour vérifier si votre contenu est conforme à celles-ci. Le problème peut être causé par du contenu indésirable ou un usage abusif du balisage. Cependant, le problème ne peut pas être un problème de syntaxe, et le test des résultats enrichis ne pourra pas identifier ces problèmes. Dépannez les résultats enrichis manquants / la baisse du nombre total de résultats enrichis. Laissez du temps pour le nouveau crawl et la nouvelle indexation. N’oubliez pas qu’il peut falloir plusieurs jours après la publication d’une page pour que Google la trouve et la crawl. Pour des questions générales sur le crawling et l’indexation, consultez la FAQ sur le crawling et l’indexation de Google Search. Posez une question dans le forum de Google Search Central.
Googlebot
Googlebot est le nom générique des deux types de robots d’exploration de Google :
Googlebot Bureau : un robot d’exploration de bureau qui simule un utilisateur sur un ordinateur de bureau.
Googlebot Smartphone : un robot d’exploration mobile qui simule un utilisateur sur un appareil mobile.
Vous pouvez identifier le sous-type de Googlebot en regardant la chaîne d’agent utilisateur dans la requête. Cependant, les deux types de robots obéissent au même jeton de produit (jeton d’agent utilisateur) dans le fichier robots.txt, vous ne pouvez donc pas cibler spécifiquement Googlebot Smartphone ou Googlebot Bureau à l’aide de robots.txt.
Pour la plupart des sites, Google indexe principalement la version mobile du contenu. Ainsi, la majorité des demandes de crawl de Googlebot seront effectuées à l’aide du robot mobile, et une minorité à l’aide du robot de bureau.
Comment Googlebot accède à votre site
Pour la plupart des sites, Googlebot ne devrait pas accéder à votre site plus d’une fois toutes les quelques secondes en moyenne. Cependant, en raison des délais, il est possible que le taux apparaisse légèrement plus élevé sur de courtes périodes.
Googlebot a été conçu pour être exécuté simultanément par des milliers de machines afin d’améliorer les performances et d’évoluer à mesure que le web se développe. De plus, pour réduire l’utilisation de la bande passante, nous exécutons de nombreux robots d’exploration sur des machines situées près des sites qu’ils pourraient explorer. Par conséquent, vos journaux peuvent montrer des visites provenant de plusieurs adresses IP, toutes avec l’agent utilisateur Googlebot. Notre objectif est d’explorer autant de pages de votre site que possible à chaque visite sans surcharger votre serveur. Si votre site a du mal à suivre les demandes de crawl de Google, vous pouvez réduire le taux de crawl.
Googlebot explore principalement à partir d’adresses IP situées aux États-Unis. Si Googlebot détecte qu’un site bloque les demandes en provenance des États-Unis, il peut tenter d’explorer à partir d’adresses IP situées dans d’autres pays. La liste des blocs d’adresses IP actuellement utilisés par Googlebot est disponible au format JSON.
Googlebot explore via HTTP/1.1 et, si pris en charge par le site, HTTP/2. Il n’y a pas d’avantage en termes de classement basé sur la version du protocole utilisée pour explorer votre site ; cependant, l’exploration via HTTP/2 peut économiser des ressources informatiques (par exemple, CPU, RAM) pour votre site et Googlebot.
Pour refuser l’exploration via HTTP/2, demandez au serveur hébergeant votre site de répondre avec un code d’état HTTP 421 lorsque Googlebot tente d’explorer votre site via HTTP/2. Si cela n’est pas possible, vous pouvez envoyer un message à l’équipe de Googlebot (cependant, cette solution est temporaire).
Googlebot peut explorer les 15 premiers Mo d’un fichier HTML ou d’un fichier texte pris en charge. Chaque ressource référencée dans le HTML, comme CSS et JavaScript, est récupérée séparément, et chaque récupération est soumise à la même limite de taille de fichier. Après les 15 premiers Mo du fichier, Googlebot cesse d’explorer et ne considère que les 15 premiers Mo du fichier pour l’indexation. La limite de taille de fichier s’applique aux données non compressées. D’autres robots Google, tels que Googlebot Vidéo et Googlebot Image, peuvent avoir des limites différentes.
Lorsqu’il explore à partir d’adresses IP aux États-Unis, le fuseau horaire de Googlebot est le fuseau horaire du Pacifique.
Bloquer Googlebot de visiter votre site
Il est presque impossible de garder un serveur web secret en ne publiant pas de liens vers celui-ci. Par exemple, dès qu’une personne suit un lien depuis votre serveur « secret » vers un autre serveur web, votre URL « secrète » peut apparaître dans la balise référente et peut être stockée et publiée par l’autre serveur web dans son journal référent. De même, le web contient de nombreux liens obsolètes et brisés. Chaque fois que quelqu’un publie un lien incorrect vers votre site ou oublie de mettre à jour les liens pour refléter les changements sur votre serveur, Googlebot essaiera d’explorer un lien incorrect depuis votre site.
Si vous souhaitez empêcher Googlebot d’explorer le contenu de votre site, vous avez plusieurs options. Soyez conscient de la différence entre empêcher Googlebot d’explorer une page, empêcher Googlebot d’indexer une page et empêcher une page d’être accessible à la fois par les robots d’exploration et par les utilisateurs.
Vérifier Googlebot
Avant de décider de bloquer Googlebot, sachez que la chaîne d’agent utilisateur utilisée par Googlebot est souvent imitée par d’autres robots. Il est important de vérifier qu’une demande problématique provient réellement de Google. La meilleure façon de vérifier qu’une demande provient réellement de Googlebot est d’utiliser une recherche DNS inversée sur l’IP source de la demande ou de comparer l’IP source avec les plages d’IP de Googlebot.
Recent Comments