Alien Road Company

Google SEO Update 2023 October 17

  • 2023年10月17日: 記事の構造化データにタイムゾーンを提供するようにリマインダーを追加し、タイムゾーンが提供されない場合に何が起こるかを明確にしました。 Googlebotのタイムゾーンについての言及を追加しました。タイムゾーンはPSTです。

記事(Article、NewsArticle、BlogPosting)の構造化データ

ニュース、ブログ、スポーツ記事のページに記事(Article)構造化データを追加することで、Googleはウェブページについてより多くの情報を理解し、Google検索や他のプロパティ(例えば、GoogleニュースやGoogleアシスタント)の検索結果で、記事に対してより良いタイトルテキスト、画像、および日付情報を表示できます。トップストーリーのようなGoogleニュースの機能に対するマークアップ要件はありませんが、記事を追加することで、Googleにコンテンツの内容(例えば、それがニュース記事であること、著者が誰であるか、または記事のタイトルが何であるか)をより明確に伝えることができます。

Article rich result

こちらは、記事(Article)構造化データを持つページの例です。

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

構造化データの追加方法

構造化データは、ページに関する情報を提供し、ページの内容を分類するための標準化された形式です。構造化データに不慣れな場合は、構造化データがどのように機能するかについて詳しく学ぶことができます。

ここでは、構造化データを構築、テスト、および公開する方法の概要を示します。ウェブページに構造化データを追加するためのステップバイステップのガイドについては、構造化データのコーディングラボを参照してください。

あなたのウェブページに適用される推奨プロパティをできるだけ多く追加してください。必須プロパティはなく、代わりにコンテンツに適用されるプロパティを追加します。使用しているフォーマットに基づいて、ページに構造化データを挿入する場所を学んでください。

CMSを使用していますか? CMSに統合されたプラグインを使用する方が簡単かもしれません。 JavaScriptを使用していますか? JavaScriptで構造化データを生成する方法を学びましょう。 ガイドラインに従ってください。 リッチリザルトテストを使用してコードを検証し、重大なエラーを修正します。また、ツールでフラグが付けられる可能性のある非重大な問題も修正することを検討してください。これにより、構造化データの品質を向上させることができます(ただし、リッチリザルトの対象となるために必要ではありません)。 構造化データを含むいくつかのページを展開し、URL検査ツールを使用してGoogleがページをどのように見るかをテストします。ページがGoogleにアクセス可能であり、robots.txtファイル、noindexタグ、またはログイン要件によってブロックされていないことを確認してください。ページが問題ない場合は、GoogleにURLの再クロールを依頼できます。

注意:再クロールと再インデックス作成に時間を許可してください。ページを公開した後、Googleがそれを見つけてクロールするのに数日かかることがあります。 今後の変更をGoogleに通知するために、サイトマップを送信することをお勧めします。これをSearch Console Sitemap APIで自動化できます。

ガイドライン

構造化データがGoogle検索結果に含まれるためには、これらのガイドラインに従う必要があります。

警告:サイトがこれらのガイドラインの1つ以上を違反した場合、Googleは手動での措置を講じることがあります。問題を修正したら、サイトを再評価のために送信できます。 検索の基本 一般的な構造化データのガイドライン 技術的ガイドライン 技術的ガイドライン 複数パートの記事の場合、rel=canonicalが各個別ページまたは「すべて表示」ページを指していることを確認してください(複数パートのシリーズの1ページ目ではありません)。正規化について詳しく学びましょう。 ウェブサイトのコンテンツへのサブスクリプションベースのアクセスを提供する場合や、ユーザーがアクセスのために登録する必要がある場合は、サブスクリプションおよびペイウォールコンテンツ用の構造化データを追加することを検討してください。

構造化データのタイプ定義

Googleがページをよりよく理解できるようにするために、ウェブページに適用される推奨プロパティをできるだけ多く含めてください。必須プロパティはなく、代わりにコンテンツに適用されるプロパティを追加してください。

記事オブジェクト

記事オブジェクトは、次のschema.orgタイプのいずれかに基づく必要があります:Article、NewsArticle、BlogPosting。

Googleがサポートするプロパティは以下の通りです:

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an “about me” page, or a bio page.

If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.

Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

著者マークアップのベストプラクティス

Googleがコンテンツの著者を最適に理解し、表現するのを助けるために、マークアップで著者を指定する際に以下のベストプラクティスに従うことをお勧めします:

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like “posted by”).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

著者マークアップのベストプラクティスを適用した例を以下に示します:

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

トラブルシューティング

構造化データの実装やデバッグに問題がある場合、以下のリソースが役立つかもしれません。

コンテンツ管理システム(CMS)を使用している場合や、他の誰かがあなたのサイトの管理を行っている場合は、助けを求めてください。問題の詳細を含むSearch Consoleのメッセージを彼らに転送することを忘れないでください。 Googleは、構造化データを使用する機能が検索結果に表示されることを保証していません。Googleがリッチ結果にコンテンツを表示しない一般的な理由のリストについては、一般的な構造化データガイドラインを参照してください。 構造化データにエラーがあるかもしれません。構造化データエラーのリストを確認してください。 ページに対して構造化データの手動アクションを受けた場合、そのページの構造化データは無視されます(ただし、ページはGoogle検索結果に表示される可能性があります)。構造化データの問題を修正するには、手動アクションレポートを使用してください。 ガイドラインを再度確認して、コンテンツがガイドラインに準拠していないかどうかを確認してください。問題は、スパムのようなコンテンツやスパムのようなマークアップの使用によって引き起こされる可能性があります。ただし、問題が構文の問題ではない場合、リッチ結果テストではこれらの問題を特定できない可能性があります。 リッチ結果が見つからないことや、総リッチ結果の減少についてトラブルシューティングします。 再クロールと再インデックス化の時間を許可してください。ページを公開した後、Googleがそれを見つけてクロールするまでに数日かかることを覚えておいてください。クロールとインデックス化に関する一般的な質問については、Google検索のクロールとインデックス化に関するFAQを確認してください。 Google Search Centralフォーラムに質問を投稿してください。


Googlebot

Googlebotは、Googleの2種類のウェブクローラーの一般的な名称です。

  • Googlebotデスクトップ: デスクトップユーザーをシミュレートするデスクトップクローラーです。
  • Googlebotスマートフォン: モバイルデバイスでユーザーをシミュレートするモバイルクローラーです。

Googlebotのサブタイプは、リクエスト内のユーザーエージェント文字列を確認することで特定できます。ただし、両方のクローラータイプはrobots.txtで同じ製品トークン(ユーザーエージェントトークン)に従うため、robots.txtを使用してGooglebotスマートフォンまたはGooglebotデスクトップのいずれかを選択的にターゲットすることはできません。

ほとんどのサイトでは、Googleは主にコンテンツのモバイルバージョンをインデックスします。そのため、Googlebotのクローリングリクエストの大部分はモバイルクローラーを使用して行われ、一部はデスクトップクローラーを使用して行われます。

Googlebotがあなたのサイトにアクセスする方法

ほとんどのサイトでは、Googlebotは平均して数秒ごとにあなたのサイトにアクセスするべきではありません。ただし、遅延があるため、短期間で少し高く見えることがあります。

Googlebotは、ウェブが成長するにつれてパフォーマンスを向上させ、スケールを実現するために、数千のマシンによって同時に実行されるように設計されています。また、帯域幅の使用量を削減するために、クローリングする可能性のあるサイトの近くにあるマシンで多くのクローラーを実行しています。そのため、ログにはすべてGooglebotユーザーエージェントを持つ複数のIPアドレスからの訪問が表示されることがあります。私たちの目標は、各訪問でできるだけ多くのページをクローリングし、あなたのサーバーを圧倒しないことです。あなたのサイトがGoogleのクローリングリクエストに追いつけない場合、クローリング率を減少させることができます。

Googlebotは主にアメリカ合衆国のIPアドレスからクローリングを行います。Googlebotがサイトがアメリカ合衆国からのリクエストをブロックしていると検出した場合、他の国にあるIPアドレスからクローリングを試みることがあります。Googlebotによって使用される現在のIPアドレスブロックのリストはJSON形式で利用可能です。

GooglebotはHTTP/1.1経由で、サイトがサポートしている場合はHTTP/2経由でもクローリングを行います。どのプロトコルバージョンがサイトをクローリングするために使用されているかに基づいてランキング上の利点はありません。ただし、HTTP/2経由でのクローリングは、サイトとGooglebotの計算リソース(例:CPU、RAM)の節約につながる可能性があります。HTTP/2経由でのクローリングをオプトアウトするには、サイトをホストしているサーバーに、GooglebotがHTTP/2経由でサイトをクローリングしようとしたときに421 HTTPステータスコードで応答するように指示します。これが不可能な場合、Googlebotチームにメッセージを送信できます(ただし、この解決策は一時的なものです)。

GooglebotはHTMLファイルまたはサポートされているテキストベースのファイルの最初の15MBをクローリングできます。HTML内で参照される各リソースは、CSSやJavaScriptなど別々に取得され、各取得は同じファイルサイズ制限に従います。ファイルの最初の15MBを超えると、Googlebotはクローリングを停止し、インデックス作成のためにファイルの最初の15MBのみを考慮します。ファイルサイズ制限は、未圧縮データに適用されます。他のGoogleクローラー(たとえば、Googlebot VideoやGooglebot Image)は異なる制限を持つ場合があります。

アメリカ合衆国からクローリングを行う際、Googlebotのタイムゾーンは太平洋標準時(PST)です。

Googlebotがあなたのサイトを訪れるのを防ぐ

ウェブサーバーを秘密にすることはほとんど不可能です。たとえば、「秘密」のサーバーから別のウェブサーバーへのリンクが誰かによって追跡されると、「秘密」のURLがリファラータグに表示され、他のウェブサーバーによってリファラーログに保存され公開される可能性があります。同様に、ウェブには多くの古いリンクや壊れたリンクがあります。誰かがあなたのサイトへの不正確なリンクを公開したり、サーバーの変更を反映するためにリンクを更新するのを忘れたりすると、Googlebotはあなたのサイトの不正確なリンクをクローリングしようとします。

Googlebotがあなたのサイトのコンテンツをクローリングするのを防ぎたい場合、いくつかのオプションがあります。Googlebotがページをクローリングするのを防ぐこと、Googlebotがページをインデックスするのを防ぐこと、そしてページがクローラーやユーザーのいずれからも完全にアクセスできないようにすることの違いに注意してください。

Googlebotの検証

Googlebotをブロックすることを決定する前に、Googlebotが使用するユーザーエージェント文字列が他のクローラーによってしばしば偽装されることを知っておくべきです。問題のリクエストが本当にGoogleからのものであるかどうかを確認することが重要です。リクエストが実際にGooglebotから来ているかどうかを確認する最良の方法は、リクエストの送信元IPで逆DNSルックアップを使用するか、送信元IPをGooglebotのIP範囲と照合することです。