Alien Road Company

Google SEO Update 2023 October 17

  • 17 अक्टूबर: लेख संरचित डेटा में समय क्षेत्र प्रदान करने के लिए एक अनुस्मारक जोड़ा गया और यह स्पष्ट किया गया कि यदि समय क्षेत्र प्रदान नहीं किया जाता है तो क्या होता है। Googlebot के समय क्षेत्र के बारे में उल्लेख किया गया, जो PST है।

लेख (लेख, समाचार लेख, ब्लॉग पोस्टिंग) संरचित डेटा

आपके समाचार, ब्लॉग और खेल लेख पृष्ठों में लेख संरचित डेटा जोड़ने से Google को वेब पृष्ठ के बारे में अधिक समझने में मदद मिल सकती है और Google खोज परिणामों और अन्य संपत्तियों (जैसे Google समाचार और Google सहायक) में लेख के लिए बेहतर शीर्षक पाठ, चित्र और दिनांक जानकारी प्रदर्शित कर सकती है। जबकि शीर्ष कहानियों जैसी Google समाचार सुविधाओं के लिए कोई मार्कअप आवश्यकता नहीं है, आप अपने सामग्री के बारे में Google को अधिक स्पष्ट रूप से बताने के लिए लेख जोड़ सकते हैं (उदाहरण के लिए, कि यह एक समाचार लेख है, लेखक कौन है, या लेख का शीर्षक क्या है)।

Article rich result

उदाहरण

यहां एक पृष्ठ का उदाहरण है जिसमें लेख संरचित डेटा है।

<html>
  <head>
    <title>Title of a News Article</title>
    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "NewsArticle",
      "headline": "Title of a News Article",
      "image": [
        "https://example.com/photos/1x1/photo.jpg",
        "https://example.com/photos/4x3/photo.jpg",
        "https://example.com/photos/16x9/photo.jpg"
       ],
      "datePublished": "2015-02-05T08:00:00+08:00",
      "dateModified": "2015-02-05T09:20:00+08:00",
      "author": [{
          "@type": "Person",
          "name": "Jane Doe",
          "url": "https://example.com/profile/janedoe123"
        },{
          "@type": "Person",
          "name": "John Doe",
          "url": "https://example.com/profile/johndoe123"
      }]
    }
    </script>
  </head>
  <body>
  </body>
</html>

संरचित डेटा कैसे जोड़ें

संरचित डेटा एक मानकीकृत प्रारूप है जो एक पृष्ठ के बारे में जानकारी प्रदान करने और पृष्ठ सामग्री को वर्गीकृत करने के लिए है। यदि आप संरचित डेटा में नए हैं, तो आप यह जान सकते हैं कि संरचित डेटा कैसे काम करता है।

यहां संरचित डेटा बनाने, परीक्षण करने और जारी करने के लिए एक अवलोकन है। एक वेब पृष्ठ पर संरचित डेटा कैसे जोड़ने के लिए चरण-दर-चरण मार्गदर्शिका के लिए, संरचित डेटा कोडलेब देखें।

अपनी वेब पृष्ठ पर लागू होने वाली जितनी संभव हो, उतनी अनुशंसित विशेषताएँ जोड़ें। कोई आवश्यक विशेषताएँ नहीं हैं; इसके बजाय, उन विशेषताओं को जोड़ें जो आपकी सामग्री पर लागू होती हैं। जिस प्रारूप का आप उपयोग कर रहे हैं, उसके आधार पर, जानें कि पृष्ठ पर संरचित डेटा कहां डालना है।

क्या आप एक CMS का उपयोग कर रहे हैं? अपने CMS में एकीकृत प्लगइन का उपयोग करना अधिक आसान हो सकता है। क्या आप JavaScript का उपयोग कर रहे हैं? जानें कि JavaScript के साथ संरचित डेटा कैसे उत्पन्न करें। दिशानिर्देशों का पालन करें। अपने कोड को रिच रिजल्ट्स टेस्ट का उपयोग करके मान्य करें और किसी भी महत्वपूर्ण त्रुटियों को ठीक करें। विचार करें कि उन गैर-महत्वपूर्ण मुद्दों को भी ठीक करें जो उपकरण में चिह्नित हो सकते हैं, क्योंकि वे आपके संरचित डेटा की गुणवत्ता में सुधार करने में मदद कर सकते हैं (हालांकि, यह रिच रिजल्ट्स के लिए पात्र होने के लिए आवश्यक नहीं है)। अपनी संरचित डेटा शामिल करने वाली कुछ पृष्ठों को तैनात करें और यह परीक्षण करने के लिए URL निरीक्षण उपकरण का उपयोग करें कि Google पृष्ठ को कैसे देखता है। सुनिश्चित करें कि आपकी पृष्ठ Google के लिए उपलब्ध है और इसे robots.txt फ़ाइल, noindex टैग या लॉगिन आवश्यकताओं द्वारा अवरुद्ध नहीं किया गया है। यदि पृष्ठ ठीक दिखता है, तो आप Google से अपने URLs को पुन: क्रॉल करने के लिए कह सकते हैं।

नोट: पुनः क्रॉल और पुनः अनुक्रमण के लिए समय दें। याद रखें कि Google को एक पृष्ठ प्रकाशित करने के बाद उसे खोजने और क्रॉल करने में कई दिन लग सकते हैं। भविष्य के परिवर्तनों के बारे में Google को सूचित रखने के लिए, हम अनुशंसा करते हैं कि आप एक साइटमैप सबमिट करें। आप इसे सर्च कंसोल साइटमैप API के साथ स्वचालित कर सकते हैं।

निर्देश

आपको इन निर्देशों का पालन करना चाहिए ताकि संरचित डेटा Google खोज परिणामों में शामिल होने के लिए पात्र हो सके।

चेतावनी: यदि आपकी साइट इन निर्देशों में से एक या अधिक का उल्लंघन करती है, तो Google इसके खिलाफ मैनुअल कार्रवाई कर सकता है। एक बार जब आप समस्या को ठीक कर लें, तो आप अपने साइट को पुनः विचार के लिए सबमिट कर सकते हैं।

  • खोज आवश्यकताएँ
  • सामान्य संरचित डेटा दिशानिर्देश
  • तकनीकी दिशानिर्देश

तकनीकी दिशानिर्देश

  • बहु-भाग वाले लेखों के लिए, सुनिश्चित करें कि rel=canonical या तो प्रत्येक व्यक्तिगत पृष्ठ की ओर इशारा करता है या “सभी देखें” पृष्ठ (और बहु-भाग श्रृंखला के पृष्ठ 1 की ओर नहीं)। कैनोनिकलाइजेशन के बारे में अधिक जानें।
  • यदि आप अपनी वेबसाइट सामग्री के लिए सब्सक्रिप्शन-आधारित पहुंच की पेशकश करते हैं, या यदि उपयोगकर्ताओं को पहुंच के लिए पंजीकरण करना आवश्यक है, तो सब्सक्रिप्शन और भुगतान वाले सामग्री के लिए संरचित डेटा जोड़ने पर विचार करें।

संरचित डेटा प्रकार परिभाषाएँ

Google को आपकी पृष्ठ को बेहतर समझने में मदद करने के लिए, अपनी वेब पृष्ठ पर लागू होने वाली जितनी संभव हो, उतनी अनुशंसित विशेषताएँ जोड़ें। कोई आवश्यक विशेषताएँ नहीं हैं; इसके बजाय, उन विशेषताओं को जोड़ें जो आपकी सामग्री पर लागू होती हैं।

लेख वस्तुएँ

लेख वस्तुएँ निम्नलिखित schema.org प्रकारों में से एक पर आधारित होनी चाहिए: Article, NewsArticle, BlogPosting।

Google द्वारा समर्थित विशेषताएँ निम्नलिखित हैं:

Recommended properties
author Person or OrganizationThe author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices.
author.name TextThe name of the author.
author.url URLA link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an “about me” page, or a bio page.

If the URL is an internal profile page, we recommend marking up that author using profile page structured data.

dateModified DateTimeThe date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the dateModified property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

datePublished DateTimeThe date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.

Add the datePublished property if you want to provide more accurate date information to Google. The Rich Results Test doesn’t show a warning for this property, as it’s only recommended if you decide that it’s applicable to your site.

headline TextThe title of the article. Consider using a concise title, as long titles may be truncated on some devices.
image Repeated ImageObject or URLThe URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.

Additional image guidelines:

  • Image URLs must be crawlable and indexable. To check if Google can access your URLs, use the URL Inspection tool.
  • Images must represent the marked up content.
  • Images must be in a file format that’s supported by Google Images.
  • For best results, we recommend providing multiple high-resolution images (minimum of 50K pixels when multiplying width and height) with the following aspect ratios: 16×9, 4×3, and 1×1.

For example:

"image": [
  "https://example.com/photos/1x1/photo.jpg",
  "https://example.com/photos/4x3/photo.jpg",
  "https://example.com/photos/16x9/photo.jpg"
]

लेखक मार्कअप के सर्वोत्तम अभ्यास

सामग्री के लेखक को सबसे अच्छा समझने और प्रस्तुत करने में Google की मदद करने के लिए, हम मार्कअप में लेखकों को निर्दिष्ट करते समय निम्नलिखित सर्वोत्तम अभ्यासों का पालन करने की सिफारिश करते हैं:

Best practices for author markup

Include all authors in the markup

Make sure that all the authors that are presented as authors on the web page are also included in markup.

Specifying multiple authors

When specifying multiple authors, list each author in their own author field:

"author": [
  {"name": "Willow Lane"},
  {"name": "Regula Felix"}
]

Don’t merge multiple authors in the same author field:

"author": {
  "name": "Willow Lane, Regula Felix"
}

Use additional fields

To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:

"author": [
  {
    "@type": "Person",
    "name": "Willow Lane",
    "url": "https://www.example.com/staff/willow_lane"
  }
]

If the author is an organization, you could link to the organization’s home page.

"author":
  [
    {
      "@type":"Organization",
      "name": "Some News Agency",
      "url": "https://www.example.com/"
  }
]

Only specify the author’s name in the author.name property

In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:

  • The name of the publisher. Instead, use the publisher property.
  • The author’s job title. Instead, use the appropriate property if you want to specify that information (jobTitle).
  • Honorific prefix or suffix. Instead, use the appropriate property if you want to specify that information (honorificPrefix or honorificSuffix).
  • Introductory words (for example, don’t include words like “posted by”).
"author":
  [
    {
      "name": "Echidna Jones",
      "honorificPrefix": "Dr",
      "jobTitle": "Editor in Chief"
    }
  ],
"publisher":
  [
    {
      "name": "Bugs Daily"
    }
  ]
}

Use the appropriate Type

Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person).

यहां एक उदाहरण है जो लेखक मार्कअप के सर्वोत्तम अभ्यासों को लागू करता है:

"author":
  [
    {
      "@type": "Person",
      "name": "Willow Lane",
      "jobTitle": "Journalist",
      "url": "https://www.example.com/staff/willow-lane"
    },
    {
      "@type": "Person",
      "name": "Echidna Jones",
      "jobTitle": "Editor in Chief",
      "url": "https://www.example.com/staff/echidna-jones"
    }
  ],
"publisher":
  {
    "name": "The Daily Bug",
    "url": "https://www.example.com"
  },
  // + Other fields related to the article...
}

समस्या निवारण

यदि आप संरचित डेटा लागू करने या डिबग करने में परेशानी महसूस कर रहे हैं, तो यहां कुछ संसाधन हैं जो आपकी मदद कर सकते हैं।

यदि आप एक सामग्री प्रबंधन प्रणाली (CMS) का उपयोग कर रहे हैं या कोई और आपकी साइट का ध्यान रख रहा है, तो उनसे मदद मांगें। सुनिश्चित करें कि किसी भी समस्या का विवरण देने वाले खोज कंसोल संदेश को उन्हें आगे बढ़ा दें। Google यह garanti नहीं देता है कि संरचित डेटा का उपभोग करने वाली सुविधाएं खोज परिणामों में दिखाई देंगी। यदि Google आपके सामग्री को समृद्ध परिणाम में नहीं दिखा सकता है तो इसके सामान्य कारणों की सूची के लिए, सामान्य संरचित डेटा दिशानिर्देश देखें। आपके संरचित डेटा में कोई त्रुटि हो सकती है। संरचित डेटा त्रुटियों की सूची की जांच करें। यदि आपके पृष्ठ के खिलाफ संरचित डेटा मैनुअल कार्रवाई की गई है, तो पृष्ठ पर संरचित डेटा को नजरअंदाज किया जाएगा (हालांकि पृष्ठ अभी भी Google खोज परिणामों में दिखाई दे सकता है)। संरचित डेटा समस्याओं को ठीक करने के लिए, मैनुअल कार्रवाई रिपोर्ट का उपयोग करें। एक बार फिर से दिशानिर्देशों की समीक्षा करें यह पहचानने के लिए कि क्या आपका सामग्री दिशानिर्देशों के अनुपालन में नहीं है। समस्या या तो स्पैमी सामग्री या स्पैमी मार्कअप उपयोग के कारण हो सकती है। हालाँकि, समस्या एक वाक्य रचना समस्या नहीं हो सकती है, इसलिए समृद्ध परिणाम परीक्षण इन समस्याओं की पहचान नहीं कर सकेगा। निष्क्रिय समृद्ध परिणामों की समस्या निवारण करें / कुल समृद्ध परिणामों में गिरावट करें। पुनः क्रॉल और पुनः अनुक्रमण के लिए समय की अनुमति दें। याद रखें कि Google के लिए किसी पृष्ठ को खोजने और क्रॉल करने में कुछ दिन लग सकते हैं। क्रॉलिंग और अनुक्रमण के बारे में सामान्य प्रश्नों के लिए, Google खोज क्रॉलिंग और अनुक्रमण FAQ की जांच करें। Google खोज केंद्रीय फोरम में एक प्रश्न पोस्ट करें।


Googlebot

Googlebot, Google के दो प्रकार के वेब क्रॉलर के लिए सामान्य नाम है:

Googlebot डेस्कटॉप: एक डेस्कटॉप क्रॉलर जो डेस्कटॉप उपयोगकर्ता का अनुकरण करता है।
Googlebot स्मार्टफोन: एक मोबाइल क्रॉलर जो मोबाइल डिवाइस पर उपयोगकर्ता का अनुकरण करता है।

आप Googlebot के उपप्रकार की पहचान उस अनुरोध में उपयोगकर्ता एजेंट स्ट्रिंग को देखकर कर सकते हैं। हालाँकि, दोनों क्रॉलर प्रकार robots.txt में समान उत्पाद टोकन (उपयोगकर्ता एजेंट टोकन) का पालन करते हैं, इसलिए आप robots.txt का उपयोग करके Googlebot स्मार्टफोन या Googlebot डेस्कटॉप को अलग से लक्षित नहीं कर सकते हैं।

ज्यादातर साइटों के लिए, Google सामग्री के मोबाइल संस्करण को मुख्य रूप से अनुक्रमित करता है। इसलिए, Googlebot के क्रॉल अनुरोधों का अधिकांश हिस्सा मोबाइल क्रॉलर का उपयोग करके किया जाएगा, और अल्पसंख्यक डेस्कटॉप क्रॉलर का उपयोग करके किया जाएगा।

Googlebot आपकी साइट तक कैसे पहुँचता है

ज्यादातर साइटों के लिए, Googlebot को औसतन हर कुछ सेकंड में आपकी साइट पर एक बार से अधिक नहीं पहुँचाना चाहिए। हालाँकि, विलंब के कारण, यह दर कुछ समय के लिए थोड़ी अधिक दिखाई दे सकती है।

Googlebot को हजारों मशीनों द्वारा एक साथ चलाने के लिए डिज़ाइन किया गया था ताकि प्रदर्शन में सुधार हो सके और जब वेब बढ़ता है तो इसे स्केल किया जा सके। इसके अलावा, बैंडविड्थ उपयोग को कम करने के लिए, हम उन साइटों के पास मशीनों पर कई क्रॉलर चलाते हैं जिन्हें वे क्रॉल कर सकते हैं। इसलिए, आपके लॉग में Googlebot उपयोगकर्ता एजेंट के साथ कई आईपी पते से आने वाले दौरे दिख सकते हैं। हमारा लक्ष्य है कि हम प्रत्येक दौरे पर आपकी साइट से जितनी संभव हो सके उतनी पृष्ठों को क्रॉल करें बिना आपके सर्वर को ओवरवेल्म किए। यदि आपकी साइट Google के क्रॉल अनुरोधों के साथ बने रहने में कठिनाई महसूस कर रही है, तो आप क्रॉल दर को कम कर सकते हैं।

Googlebot मुख्य रूप से अमेरिका में आईपी पते से क्रॉल करता है। यदि Googlebot यह पता लगाता है कि एक साइट अमेरिका से आने वाले अनुरोधों को रोक रही है, तो यह अन्य देशों में स्थित आईपी पते से क्रॉल करने का प्रयास कर सकता है। Googlebot द्वारा उपयोग किए जाने वाले वर्तमान आईपी पते ब्लॉकों की सूची JSON प्रारूप में उपलब्ध है।

Googlebot HTTP/1.1 के साथ-साथ साइट द्वारा समर्थित होने पर HTTP/2 पर भी क्रॉल करता है। आपकी साइट को क्रॉल करने के लिए किस प्रोटोकॉल संस्करण का उपयोग किया गया है, इसके आधार पर कोई रैंकिंग लाभ नहीं है; हालाँकि, HTTP/2 पर क्रॉल करना आपकी साइट और Googlebot के लिए कंप्यूटिंग संसाधनों (जैसे CPU, RAM) को बचा सकता है। यदि आप HTTP/2 पर क्रॉल करने से बाहर निकलना चाहते हैं, तो अपने साइट को होस्ट करने वाले सर्वर को बताएं कि Googlebot जब आपकी साइट को HTTP/2 पर क्रॉल करने का प्रयास करे तो 421 HTTP स्थिति कोड के साथ उत्तर दे। यदि यह संभव नहीं है, तो आप Googlebot टीम को एक संदेश भेज सकते हैं (हालाँकि यह समाधान अस्थायी है)।

Googlebot एक HTML फ़ाइल या समर्थित पाठ-आधारित फ़ाइल के पहले 15MB को क्रॉल कर सकता है। HTML में संदर्भित प्रत्येक संसाधन, जैसे CSS और JavaScript को अलग-अलग लाया जाता है, और प्रत्येक फ़ेच उसी फ़ाइल आकार सीमा द्वारा बाधित होता है। फ़ाइल के पहले 15MB के बाद, Googlebot क्रॉल करना बंद कर देता है और फ़ाइल के पहले 15MB को केवल अनुक्रमित करने के लिए ध्यान में रखता है। फ़ाइल आकार सीमा अव्यवस्थित डेटा पर लागू होती है। अन्य Google क्रॉलर, जैसे Googlebot Video और Googlebot Image, में भिन्न सीमाएँ हो सकती हैं।

अमेरिका में क्रॉल करते समय, Googlebot का समय क्षेत्र प्रशांत समय है।

Googlebot को आपकी साइट पर जाने से रोकना

एक वेब सर्वर को सार्वजनिक लिंक न प्रकाशित करके गुप्त रखना लगभग असंभव है। उदाहरण के लिए, जैसे ही कोई आपकी “गुप्त” सर्वर से किसी अन्य वेब सर्वर पर एक लिंक का अनुसरण करता है, आपका “गुप्त” URL संदर्भित टैग में दिखाई दे सकता है और अन्य वेब सर्वर द्वारा उसके संदर्भ लॉग में संग्रहीत और प्रकाशित किया जा सकता है। इसी तरह, वेब पर कई पुरानी और खराब लिंक हैं। जब कोई आपकी साइट के लिए गलत लिंक प्रकाशित करता है या सर्वर में परिवर्तनों को दर्शाने के लिए लिंक को अपडेट करने में विफल रहता है, तो Googlebot आपकी साइट से गलत लिंक को क्रॉल करने का प्रयास करेगा।

यदि आप Googlebot को अपनी साइट पर सामग्री क्रॉल करने से रोकना चाहते हैं, तो आपके पास कई विकल्प हैं। यह समझना महत्वपूर्ण है कि Googlebot को किसी पृष्ठ को क्रॉल करने से रोकना, Googlebot को किसी पृष्ठ को अनुक्रमित करने से रोकना, और किसी पृष्ठ को दोनों क्रॉलर या उपयोगकर्ताओं द्वारा पूरी तरह से सुलभ नहीं होने देना अलग-अलग बातें हैं।

Googlebot की पुष्टि करना

Googlebot को रोकने का निर्णय लेने से पहले, आपको यह पता होना चाहिए कि Googlebot द्वारा उपयोग की जाने वाली उपयोगकर्ता एजेंट स्ट्रिंग अक्सर अन्य क्रॉलर्स द्वारा धोखा दी जाती है। यह सत्यापित करना महत्वपूर्ण है कि एक समस्या अनुरोध वास्तव में Google से आया है। एक अनुरोध का यह सत्यापित करने का सबसे अच्छा तरीका है कि वह वास्तव में Googlebot से आता है, अनुरोध के स्रोत IP पर एक रिवर्स DNS लुकअप का उपयोग करना, या स्रोत IP को Googlebot IP रेंज के खिलाफ मिलाना है।