Alien Road Company

Google SEO Update 2023 October 17

  • 17 ottobre: Aggiunto un promemoria per fornire il fuso orario nei dati strutturati dell’articolo e chiarito cosa succede se non viene fornito un fuso orario. Aggiunta una nota riguardo al fuso orario di Googlebot, che è PST.

Dati strutturati per Articolo (Article, NewsArticle, BlogPosting)

Aggiungere dati strutturati di tipo Articolo alle tue pagine di notizie, blog e articoli sportivi può aiutare Google a comprendere meglio la pagina web e a mostrare un testo del titolo, immagini e informazioni sulla data migliori per l’articolo nei risultati di ricerca su Google Search e in altre proprietà (ad esempio, Google News e Google Assistant). Anche se non c’è un requisito di markup per essere idonei alle funzionalità di Google News come le Top Stories, puoi aggiungere Articolo per informare in modo più esplicito Google su cosa tratta il tuo contenuto (ad esempio, che si tratta di un articolo di notizie, chi è l’autore o qual è il titolo dell’articolo).

Article rich result

Esempio

Ecco un esempio di una pagina con dati strutturati di tipo Articolo.

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

Come aggiungere dati strutturati

I dati strutturati sono un formato standardizzato per fornire informazioni su una pagina e classificare il contenuto della pagina. Se sei nuovo ai dati strutturati, puoi saperne di più su come funzionano.

Ecco una panoramica su come costruire, testare e rilasciare dati strutturati. Per una guida passo passo su come aggiungere dati strutturati a una pagina web, dai un’occhiata al codelab sui dati strutturati.

Aggiungi quante più proprietà raccomandate si applicano alla tua pagina web. Non ci sono proprietà obbligatorie; invece, aggiungi le proprietà che si applicano al tuo contenuto. In base al formato che stai utilizzando, impara dove inserire i dati strutturati nella pagina.

Stai utilizzando un CMS? Potrebbe essere più facile utilizzare un plugin integrato nel tuo CMS. Stai utilizzando JavaScript? Scopri come generare dati strutturati con JavaScript. Segui le linee guida. Convalida il tuo codice utilizzando il Test dei Risultati Ricchi e correggi eventuali errori critici. Considera anche di correggere eventuali problemi non critici che potrebbero essere segnalati nello strumento, poiché possono aiutare a migliorare la qualità dei tuoi dati strutturati (tuttavia, questo non è necessario per essere idonei ai risultati ricchi). Distribuisci alcune pagine che includono i tuoi dati strutturati e utilizza lo strumento di Ispezione URL per testare come Google vede la pagina. Assicurati che la tua pagina sia accessibile a Google e non sia bloccata da un file robots.txt, dal tag noindex o da requisiti di accesso. Se la pagina sembra a posto, puoi chiedere a Google di riesaminare i tuoi URL.

Nota: Consenti tempo per la nuova scansione e la reindicizzazione. Ricorda che potrebbero essere necessari diversi giorni dopo la pubblicazione di una pagina affinché Google la trovi e la scansiona. Per tenere Google informato sulle future modifiche, ti consigliamo di inviare una sitemap. Puoi automatizzare questo con l’API Sitemap di Search Console.

Linee guida

Devi seguire queste linee guida affinché i dati strutturati siano idonei per l’inclusione nei risultati di ricerca di Google.

Avviso: Se il tuo sito viola una o più di queste linee guida, Google potrebbe intraprendere un’azione manuale contro di esso. Una volta risolto il problema, puoi inviare il tuo sito per una rivalutazione. Essenziali per la Ricerca Linee guida generali sui dati strutturati Linee guida tecniche Linee guida tecniche Per articoli in più parti, assicurati che il rel=canonical punti a ciascuna pagina individuale o a una pagina “visualizza tutto” (e non alla pagina 1 di una serie in più parti). Scopri di più sulla canonizzazione. Se offri accesso basato su abbonamento ai contenuti del tuo sito web, o se gli utenti devono registrarsi per accedere, considera di aggiungere dati strutturati per contenuti in abbonamento e con paywall.

Definizioni dei tipi di dati strutturati

Per aiutare Google a comprendere meglio la tua pagina, includi quante più proprietà raccomandate si applicano alla tua pagina web. Non ci sono proprietà obbligatorie; invece, aggiungi le proprietà che si applicano al tuo contenuto.

Oggetti Articolo

Gli oggetti Articolo devono essere basati su uno dei seguenti tipi di schema.org: Article, NewsArticle, BlogPosting.

Le proprietà supportate da Google sono le seguenti:

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an “about me” page, or a bio page.

If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.

Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

Migliori pratiche per la marcatura degli autori

Per aiutare Google a comprendere e rappresentare al meglio l’autore del contenuto, si consiglia di seguire queste migliori pratiche quando si specificano gli autori nella marcatura:

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like “posted by”).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

Ecco un esempio che applica le migliori pratiche per la marcatura degli autori:

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

Risoluzione dei problemi

Se hai difficoltà ad implementare o debuggare i dati strutturati, ecco alcune risorse che potrebbero aiutarti.

Se stai utilizzando un sistema di gestione dei contenuti (CMS) o qualcun altro si sta occupando del tuo sito, chiedi il loro aiuto. Assicurati di inoltrare qualsiasi messaggio della Search Console che dettagli il problema. Google non garantisce che le funzionalità che utilizzano dati strutturati appariranno nei risultati di ricerca. Per un elenco delle ragioni comuni per cui Google potrebbe non mostrare il tuo contenuto in un risultato ricco, consulta le Linee guida generali sui dati strutturati. Potresti avere un errore nei tuoi dati strutturati. Controlla l’elenco degli errori nei dati strutturati. Se hai ricevuto un’azione manuale sui dati strutturati contro la tua pagina, i dati strutturati sulla pagina saranno ignorati (anche se la pagina può ancora apparire nei risultati di ricerca di Google). Per risolvere i problemi con i dati strutturati, utilizza il report delle azioni manuali. Rivedi nuovamente le linee guida per identificare se il tuo contenuto non è conforme a esse. Il problema può essere causato da contenuti o utilizzo di markup spam. Tuttavia, il problema potrebbe non essere un problema di sintassi e quindi il Rich Results Test non sarà in grado di identificare queste problematiche. Risolvi i risultati ricchi mancanti o il calo dei risultati ricchi totali. Consenti tempo per il ri-crawling e la reindicizzazione. Ricorda che potrebbero essere necessari diversi giorni dopo la pubblicazione di una pagina affinché Google la trovi e la crawli. Per domande generali su crawling e indicizzazione, consulta le FAQ sul crawling e l’indicizzazione di Google. Pubblica una domanda nel forum di Google Search Central.


Googlebot

Googlebot è il nome generico per due tipi di crawler web di Google:

  • Googlebot Desktop: un crawler desktop che simula un utente su desktop.
  • Googlebot Smartphone: un crawler mobile che simula un utente su un dispositivo mobile.

Puoi identificare il sottotipo di Googlebot guardando la stringa dell’agente utente nella richiesta. Tuttavia, entrambi i tipi di crawler rispettano lo stesso token di prodotto (token dell’agente utente) nel file robots.txt, quindi non puoi targetizzare selettivamente Googlebot Smartphone o Googlebot Desktop utilizzando robots.txt.

Per la maggior parte dei siti, Google indicizza principalmente la versione mobile dei contenuti. Pertanto, la maggior parte delle richieste di crawling di Googlebot sarà effettuata utilizzando il crawler mobile, mentre una minoranza utilizzerà il crawler desktop.

Come Googlebot accede al tuo sito

Per la maggior parte dei siti, Googlebot non dovrebbe accedere al tuo sito più di una volta ogni pochi secondi in media. Tuttavia, a causa dei ritardi, è possibile che il tasso appaia leggermente più alto per brevi periodi.

Googlebot è stato progettato per essere eseguito simultaneamente da migliaia di macchine per migliorare le prestazioni e scalare man mano che il web cresce. Inoltre, per ridurre l’uso della larghezza di banda, eseguiamo molti crawler su macchine situate vicino ai siti che potrebbero essere crawled. Pertanto, i tuoi registri possono mostrare visite da diversi indirizzi IP, tutti con l’agente utente Googlebot. Il nostro obiettivo è crawlers quanti più pagine possibile dal tuo sito in ogni visita senza sovraccaricare il tuo server. Se il tuo sito ha problemi a tenere il passo con le richieste di crawling di Google, puoi ridurre il tasso di crawling.

Googlebot crawls principalmente da indirizzi IP negli Stati Uniti. Se Googlebot rileva che un sito sta bloccando richieste dagli Stati Uniti, potrebbe tentare di crawl da indirizzi IP situati in altri paesi. L’elenco degli indirizzi IP attualmente utilizzati da Googlebot è disponibile in formato JSON.

Googlebot esegue il crawling principalmente su HTTP/1.1 e, se supportato dal sito, su HTTP/2. Non c’è un vantaggio di ranking basato sulla versione del protocollo utilizzato per crawlers il tuo sito; tuttavia, il crawling su HTTP/2 può risparmiare risorse di calcolo (ad esempio, CPU, RAM) per il tuo sito e Googlebot. Per escludere il crawling su HTTP/2, istruisci il server che ospita il tuo sito a rispondere con un codice di stato HTTP 421 quando Googlebot tenta di crawlers il tuo sito su HTTP/2. Se ciò non è fattibile, puoi inviare un messaggio al team di Googlebot (tuttavia, questa soluzione è temporanea).

Googlebot può eseguire il crawling dei primi 15 MB di un file HTML o di un file basato su testo supportato. Ogni risorsa referenziata nell’HTML, come CSS e JavaScript, viene recuperata separatamente e ogni fetch è vincolato dallo stesso limite di dimensione del file. Dopo i primi 15 MB del file, Googlebot smette di crawlers e considera solo i primi 15 MB del file per l’indicizzazione. Il limite di dimensione del file si applica ai dati non compressi. Altri crawler di Google, ad esempio Googlebot Video e Googlebot Image, potrebbero avere limiti diversi.

Quando esegue il crawling da indirizzi IP negli Stati Uniti, il fuso orario di Googlebot è Pacific Time.

Bloccare Googlebot dall visitare il tuo sito

È quasi impossibile mantenere un server web segreto non pubblicando collegamenti ad esso. Ad esempio, non appena qualcuno segue un collegamento dal tuo server “segreto” a un altro server web, il tuo URL “segreto” può apparire nel tag di riferimento e può essere memorizzato e pubblicato dall’altro server web nel suo registro di riferimento. Allo stesso modo, il web ha molti collegamenti obsoleti e non funzionanti. Ogni volta che qualcuno pubblica un collegamento errato al tuo sito o non riesce ad aggiornare i collegamenti per riflettere le modifiche nel tuo server, Googlebot cercherà di crawlers un collegamento errato dal tuo sito.

Se vuoi impedire a Googlebot di crawlers contenuti sul tuo sito, hai diverse opzioni. Tieni presente la differenza tra impedire a Googlebot di crawlers una pagina, impedire a Googlebot di indicizzare una pagina e impedire che una pagina sia accessibile a entrambi i crawler o utenti.

Verifica di Googlebot

Prima di decidere di bloccare Googlebot, tieni presente che la stringa dell’agente utente utilizzata da Googlebot è spesso imitata da altri crawler. È importante verificare che una richiesta problematica provenga effettivamente da Google. Il modo migliore per verificare che una richiesta provenga effettivamente da Googlebot è utilizzare una ricerca DNS inversa sull’IP sorgente della richiesta o confrontare l’IP sorgente con gli intervalli IP di Googlebot.