- 17 अक्टूबर: लेख संरचित डेटा में समय क्षेत्र प्रदान करने के लिए एक अनुस्मारक जोड़ा गया और यह स्पष्ट किया गया कि यदि समय क्षेत्र प्रदान नहीं किया जाता है तो क्या होता है। Googlebot के समय क्षेत्र के बारे में उल्लेख किया गया, जो PST है।
लेख (लेख, समाचार लेख, ब्लॉग पोस्टिंग) संरचित डेटा
आपके समाचार, ब्लॉग और खेल लेख पृष्ठों में लेख संरचित डेटा जोड़ने से Google को वेब पृष्ठ के बारे में अधिक समझने में मदद मिल सकती है और Google खोज परिणामों और अन्य संपत्तियों (जैसे Google समाचार और Google सहायक) में लेख के लिए बेहतर शीर्षक पाठ, चित्र और दिनांक जानकारी प्रदर्शित कर सकती है। जबकि शीर्ष कहानियों जैसी Google समाचार सुविधाओं के लिए कोई मार्कअप आवश्यकता नहीं है, आप अपने सामग्री के बारे में Google को अधिक स्पष्ट रूप से बताने के लिए लेख जोड़ सकते हैं (उदाहरण के लिए, कि यह एक समाचार लेख है, लेखक कौन है, या लेख का शीर्षक क्या है)।
उदाहरण
यहां एक पृष्ठ का उदाहरण है जिसमें लेख संरचित डेटा है।
<html> <head> <title>Title of a News Article</title> <script type="application/ld+json"> { "@context": "https://schema.org", "@type": "NewsArticle", "headline": "Title of a News Article", "image": [ "https://example.com/photos/1x1/photo.jpg", "https://example.com/photos/4x3/photo.jpg", "https://example.com/photos/16x9/photo.jpg" ], "datePublished": "2015-02-05T08:00:00+08:00", "dateModified": "2015-02-05T09:20:00+08:00", "author": [{ "@type": "Person", "name": "Jane Doe", "url": "https://example.com/profile/janedoe123" },{ "@type": "Person", "name": "John Doe", "url": "https://example.com/profile/johndoe123" }] } </script> </head> <body> </body> </html>
संरचित डेटा कैसे जोड़ें
संरचित डेटा एक मानकीकृत प्रारूप है जो एक पृष्ठ के बारे में जानकारी प्रदान करने और पृष्ठ सामग्री को वर्गीकृत करने के लिए है। यदि आप संरचित डेटा में नए हैं, तो आप यह जान सकते हैं कि संरचित डेटा कैसे काम करता है।
यहां संरचित डेटा बनाने, परीक्षण करने और जारी करने के लिए एक अवलोकन है। एक वेब पृष्ठ पर संरचित डेटा कैसे जोड़ने के लिए चरण-दर-चरण मार्गदर्शिका के लिए, संरचित डेटा कोडलेब देखें।
अपनी वेब पृष्ठ पर लागू होने वाली जितनी संभव हो, उतनी अनुशंसित विशेषताएँ जोड़ें। कोई आवश्यक विशेषताएँ नहीं हैं; इसके बजाय, उन विशेषताओं को जोड़ें जो आपकी सामग्री पर लागू होती हैं। जिस प्रारूप का आप उपयोग कर रहे हैं, उसके आधार पर, जानें कि पृष्ठ पर संरचित डेटा कहां डालना है।
क्या आप एक CMS का उपयोग कर रहे हैं? अपने CMS में एकीकृत प्लगइन का उपयोग करना अधिक आसान हो सकता है। क्या आप JavaScript का उपयोग कर रहे हैं? जानें कि JavaScript के साथ संरचित डेटा कैसे उत्पन्न करें। दिशानिर्देशों का पालन करें। अपने कोड को रिच रिजल्ट्स टेस्ट का उपयोग करके मान्य करें और किसी भी महत्वपूर्ण त्रुटियों को ठीक करें। विचार करें कि उन गैर-महत्वपूर्ण मुद्दों को भी ठीक करें जो उपकरण में चिह्नित हो सकते हैं, क्योंकि वे आपके संरचित डेटा की गुणवत्ता में सुधार करने में मदद कर सकते हैं (हालांकि, यह रिच रिजल्ट्स के लिए पात्र होने के लिए आवश्यक नहीं है)। अपनी संरचित डेटा शामिल करने वाली कुछ पृष्ठों को तैनात करें और यह परीक्षण करने के लिए URL निरीक्षण उपकरण का उपयोग करें कि Google पृष्ठ को कैसे देखता है। सुनिश्चित करें कि आपकी पृष्ठ Google के लिए उपलब्ध है और इसे robots.txt फ़ाइल, noindex टैग या लॉगिन आवश्यकताओं द्वारा अवरुद्ध नहीं किया गया है। यदि पृष्ठ ठीक दिखता है, तो आप Google से अपने URLs को पुन: क्रॉल करने के लिए कह सकते हैं।
नोट: पुनः क्रॉल और पुनः अनुक्रमण के लिए समय दें। याद रखें कि Google को एक पृष्ठ प्रकाशित करने के बाद उसे खोजने और क्रॉल करने में कई दिन लग सकते हैं। भविष्य के परिवर्तनों के बारे में Google को सूचित रखने के लिए, हम अनुशंसा करते हैं कि आप एक साइटमैप सबमिट करें। आप इसे सर्च कंसोल साइटमैप API के साथ स्वचालित कर सकते हैं।
निर्देश
आपको इन निर्देशों का पालन करना चाहिए ताकि संरचित डेटा Google खोज परिणामों में शामिल होने के लिए पात्र हो सके।
चेतावनी: यदि आपकी साइट इन निर्देशों में से एक या अधिक का उल्लंघन करती है, तो Google इसके खिलाफ मैनुअल कार्रवाई कर सकता है। एक बार जब आप समस्या को ठीक कर लें, तो आप अपने साइट को पुनः विचार के लिए सबमिट कर सकते हैं।
- खोज आवश्यकताएँ
- सामान्य संरचित डेटा दिशानिर्देश
- तकनीकी दिशानिर्देश
तकनीकी दिशानिर्देश
- बहु-भाग वाले लेखों के लिए, सुनिश्चित करें कि rel=canonical या तो प्रत्येक व्यक्तिगत पृष्ठ की ओर इशारा करता है या “सभी देखें” पृष्ठ (और बहु-भाग श्रृंखला के पृष्ठ 1 की ओर नहीं)। कैनोनिकलाइजेशन के बारे में अधिक जानें।
- यदि आप अपनी वेबसाइट सामग्री के लिए सब्सक्रिप्शन-आधारित पहुंच की पेशकश करते हैं, या यदि उपयोगकर्ताओं को पहुंच के लिए पंजीकरण करना आवश्यक है, तो सब्सक्रिप्शन और भुगतान वाले सामग्री के लिए संरचित डेटा जोड़ने पर विचार करें।
संरचित डेटा प्रकार परिभाषाएँ
Google को आपकी पृष्ठ को बेहतर समझने में मदद करने के लिए, अपनी वेब पृष्ठ पर लागू होने वाली जितनी संभव हो, उतनी अनुशंसित विशेषताएँ जोड़ें। कोई आवश्यक विशेषताएँ नहीं हैं; इसके बजाय, उन विशेषताओं को जोड़ें जो आपकी सामग्री पर लागू होती हैं।
लेख वस्तुएँ
लेख वस्तुएँ निम्नलिखित schema.org प्रकारों में से एक पर आधारित होनी चाहिए: Article, NewsArticle, BlogPosting।
Google द्वारा समर्थित विशेषताएँ निम्नलिखित हैं:
Recommended properties | |
---|---|
author |
Person or Organization The author of the article. To help Google best understand authors across various features, we recommend following the author markup best practices. |
author. |
Text The name of the author. |
author. |
URL A link to a web page that uniquely identifies the author of the article. For example, the author’s social media page, an “about me” page, or a bio page.
If the URL is an internal profile page, we recommend marking up that author using profile page structured data. |
dateModified |
DateTime The date and time the article was most recently modified, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.
Add the |
datePublished |
DateTime The date and time the article was first published, in ISO 8601 format. We recommend that you provide timezone information; otherwise, we will default to the timezone used by Googlebot.
Add the |
headline |
Text The title of the article. Consider using a concise title, as long titles may be truncated on some devices. |
image |
Repeated ImageObject or URL The URL to an image that is representative of the article. Use images that are relevant to the article, rather than logos or captions.
Additional image guidelines:
For example: "image": [ "https://example.com/photos/1x1/photo.jpg", "https://example.com/photos/4x3/photo.jpg", "https://example.com/photos/16x9/photo.jpg" ] |
लेखक मार्कअप के सर्वोत्तम अभ्यास
सामग्री के लेखक को सबसे अच्छा समझने और प्रस्तुत करने में Google की मदद करने के लिए, हम मार्कअप में लेखकों को निर्दिष्ट करते समय निम्नलिखित सर्वोत्तम अभ्यासों का पालन करने की सिफारिश करते हैं:
Best practices for author markup | |
---|---|
Include all authors in the markup |
Make sure that all the authors that are presented as authors on the web page are also included in markup. |
Specifying multiple authors |
When specifying multiple authors, list each author in their own author field:
"author": [ {"name": "Willow Lane"}, {"name": "Regula Felix"} ] Don’t merge multiple authors in the same "author": { "name": "Willow Lane, Regula Felix" } |
Use additional fields |
To help Google better understand who the author is, we strongly recommend using the type and url (or sameAs ) properties. Use valid URLs for the url or sameAs properties.For example, if the author is a person, you could link to an author’s page that provides more information about the author:
"author": [ { "@type": "Person", "name": "Willow Lane", "url": "https://www.example.com/staff/willow_lane" } ] If the author is an organization, you could link to the organization’s home page. "author": [ { "@type":"Organization", "name": "Some News Agency", "url": "https://www.example.com/" } ] |
Only specify the author’s name in the
|
In the author.name property, only specify the name of the author. Don’t add any other piece of information. More specifically, don’t add the following information:
"author": [ { "name": "Echidna Jones", "honorificPrefix": "Dr", "jobTitle": "Editor in Chief" } ], "publisher": [ { "name": "Bugs Daily" } ] } |
Use the appropriate
|
Use the Person type for people, and the Organization type for organizations. Don’t use the Thing type, and don’t use the wrong type (for example, using the Organization type for a person). |
"author": [ { "@type": "Person", "name": "Willow Lane", "jobTitle": "Journalist", "url": "https://www.example.com/staff/willow-lane" }, { "@type": "Person", "name": "Echidna Jones", "jobTitle": "Editor in Chief", "url": "https://www.example.com/staff/echidna-jones" } ], "publisher": { "name": "The Daily Bug", "url": "https://www.example.com" }, // + Other fields related to the article... }
समस्या निवारण
यदि आप संरचित डेटा लागू करने या डिबग करने में परेशानी महसूस कर रहे हैं, तो यहां कुछ संसाधन हैं जो आपकी मदद कर सकते हैं।
यदि आप एक सामग्री प्रबंधन प्रणाली (CMS) का उपयोग कर रहे हैं या कोई और आपकी साइट का ध्यान रख रहा है, तो उनसे मदद मांगें। सुनिश्चित करें कि किसी भी समस्या का विवरण देने वाले खोज कंसोल संदेश को उन्हें आगे बढ़ा दें। Google यह garanti नहीं देता है कि संरचित डेटा का उपभोग करने वाली सुविधाएं खोज परिणामों में दिखाई देंगी। यदि Google आपके सामग्री को समृद्ध परिणाम में नहीं दिखा सकता है तो इसके सामान्य कारणों की सूची के लिए, सामान्य संरचित डेटा दिशानिर्देश देखें। आपके संरचित डेटा में कोई त्रुटि हो सकती है। संरचित डेटा त्रुटियों की सूची की जांच करें। यदि आपके पृष्ठ के खिलाफ संरचित डेटा मैनुअल कार्रवाई की गई है, तो पृष्ठ पर संरचित डेटा को नजरअंदाज किया जाएगा (हालांकि पृष्ठ अभी भी Google खोज परिणामों में दिखाई दे सकता है)। संरचित डेटा समस्याओं को ठीक करने के लिए, मैनुअल कार्रवाई रिपोर्ट का उपयोग करें। एक बार फिर से दिशानिर्देशों की समीक्षा करें यह पहचानने के लिए कि क्या आपका सामग्री दिशानिर्देशों के अनुपालन में नहीं है। समस्या या तो स्पैमी सामग्री या स्पैमी मार्कअप उपयोग के कारण हो सकती है। हालाँकि, समस्या एक वाक्य रचना समस्या नहीं हो सकती है, इसलिए समृद्ध परिणाम परीक्षण इन समस्याओं की पहचान नहीं कर सकेगा। निष्क्रिय समृद्ध परिणामों की समस्या निवारण करें / कुल समृद्ध परिणामों में गिरावट करें। पुनः क्रॉल और पुनः अनुक्रमण के लिए समय की अनुमति दें। याद रखें कि Google के लिए किसी पृष्ठ को खोजने और क्रॉल करने में कुछ दिन लग सकते हैं। क्रॉलिंग और अनुक्रमण के बारे में सामान्य प्रश्नों के लिए, Google खोज क्रॉलिंग और अनुक्रमण FAQ की जांच करें। Google खोज केंद्रीय फोरम में एक प्रश्न पोस्ट करें।
Googlebot
Googlebot, Google के दो प्रकार के वेब क्रॉलर के लिए सामान्य नाम है:
Googlebot डेस्कटॉप: एक डेस्कटॉप क्रॉलर जो डेस्कटॉप उपयोगकर्ता का अनुकरण करता है।
Googlebot स्मार्टफोन: एक मोबाइल क्रॉलर जो मोबाइल डिवाइस पर उपयोगकर्ता का अनुकरण करता है।
आप Googlebot के उपप्रकार की पहचान उस अनुरोध में उपयोगकर्ता एजेंट स्ट्रिंग को देखकर कर सकते हैं। हालाँकि, दोनों क्रॉलर प्रकार robots.txt में समान उत्पाद टोकन (उपयोगकर्ता एजेंट टोकन) का पालन करते हैं, इसलिए आप robots.txt का उपयोग करके Googlebot स्मार्टफोन या Googlebot डेस्कटॉप को अलग से लक्षित नहीं कर सकते हैं।
ज्यादातर साइटों के लिए, Google सामग्री के मोबाइल संस्करण को मुख्य रूप से अनुक्रमित करता है। इसलिए, Googlebot के क्रॉल अनुरोधों का अधिकांश हिस्सा मोबाइल क्रॉलर का उपयोग करके किया जाएगा, और अल्पसंख्यक डेस्कटॉप क्रॉलर का उपयोग करके किया जाएगा।
Googlebot आपकी साइट तक कैसे पहुँचता है
ज्यादातर साइटों के लिए, Googlebot को औसतन हर कुछ सेकंड में आपकी साइट पर एक बार से अधिक नहीं पहुँचाना चाहिए। हालाँकि, विलंब के कारण, यह दर कुछ समय के लिए थोड़ी अधिक दिखाई दे सकती है।
Googlebot को हजारों मशीनों द्वारा एक साथ चलाने के लिए डिज़ाइन किया गया था ताकि प्रदर्शन में सुधार हो सके और जब वेब बढ़ता है तो इसे स्केल किया जा सके। इसके अलावा, बैंडविड्थ उपयोग को कम करने के लिए, हम उन साइटों के पास मशीनों पर कई क्रॉलर चलाते हैं जिन्हें वे क्रॉल कर सकते हैं। इसलिए, आपके लॉग में Googlebot उपयोगकर्ता एजेंट के साथ कई आईपी पते से आने वाले दौरे दिख सकते हैं। हमारा लक्ष्य है कि हम प्रत्येक दौरे पर आपकी साइट से जितनी संभव हो सके उतनी पृष्ठों को क्रॉल करें बिना आपके सर्वर को ओवरवेल्म किए। यदि आपकी साइट Google के क्रॉल अनुरोधों के साथ बने रहने में कठिनाई महसूस कर रही है, तो आप क्रॉल दर को कम कर सकते हैं।
Googlebot मुख्य रूप से अमेरिका में आईपी पते से क्रॉल करता है। यदि Googlebot यह पता लगाता है कि एक साइट अमेरिका से आने वाले अनुरोधों को रोक रही है, तो यह अन्य देशों में स्थित आईपी पते से क्रॉल करने का प्रयास कर सकता है। Googlebot द्वारा उपयोग किए जाने वाले वर्तमान आईपी पते ब्लॉकों की सूची JSON प्रारूप में उपलब्ध है।
Googlebot HTTP/1.1 के साथ-साथ साइट द्वारा समर्थित होने पर HTTP/2 पर भी क्रॉल करता है। आपकी साइट को क्रॉल करने के लिए किस प्रोटोकॉल संस्करण का उपयोग किया गया है, इसके आधार पर कोई रैंकिंग लाभ नहीं है; हालाँकि, HTTP/2 पर क्रॉल करना आपकी साइट और Googlebot के लिए कंप्यूटिंग संसाधनों (जैसे CPU, RAM) को बचा सकता है। यदि आप HTTP/2 पर क्रॉल करने से बाहर निकलना चाहते हैं, तो अपने साइट को होस्ट करने वाले सर्वर को बताएं कि Googlebot जब आपकी साइट को HTTP/2 पर क्रॉल करने का प्रयास करे तो 421 HTTP स्थिति कोड के साथ उत्तर दे। यदि यह संभव नहीं है, तो आप Googlebot टीम को एक संदेश भेज सकते हैं (हालाँकि यह समाधान अस्थायी है)।
Googlebot एक HTML फ़ाइल या समर्थित पाठ-आधारित फ़ाइल के पहले 15MB को क्रॉल कर सकता है। HTML में संदर्भित प्रत्येक संसाधन, जैसे CSS और JavaScript को अलग-अलग लाया जाता है, और प्रत्येक फ़ेच उसी फ़ाइल आकार सीमा द्वारा बाधित होता है। फ़ाइल के पहले 15MB के बाद, Googlebot क्रॉल करना बंद कर देता है और फ़ाइल के पहले 15MB को केवल अनुक्रमित करने के लिए ध्यान में रखता है। फ़ाइल आकार सीमा अव्यवस्थित डेटा पर लागू होती है। अन्य Google क्रॉलर, जैसे Googlebot Video और Googlebot Image, में भिन्न सीमाएँ हो सकती हैं।
अमेरिका में क्रॉल करते समय, Googlebot का समय क्षेत्र प्रशांत समय है।
Googlebot को आपकी साइट पर जाने से रोकना
एक वेब सर्वर को सार्वजनिक लिंक न प्रकाशित करके गुप्त रखना लगभग असंभव है। उदाहरण के लिए, जैसे ही कोई आपकी “गुप्त” सर्वर से किसी अन्य वेब सर्वर पर एक लिंक का अनुसरण करता है, आपका “गुप्त” URL संदर्भित टैग में दिखाई दे सकता है और अन्य वेब सर्वर द्वारा उसके संदर्भ लॉग में संग्रहीत और प्रकाशित किया जा सकता है। इसी तरह, वेब पर कई पुरानी और खराब लिंक हैं। जब कोई आपकी साइट के लिए गलत लिंक प्रकाशित करता है या सर्वर में परिवर्तनों को दर्शाने के लिए लिंक को अपडेट करने में विफल रहता है, तो Googlebot आपकी साइट से गलत लिंक को क्रॉल करने का प्रयास करेगा।
यदि आप Googlebot को अपनी साइट पर सामग्री क्रॉल करने से रोकना चाहते हैं, तो आपके पास कई विकल्प हैं। यह समझना महत्वपूर्ण है कि Googlebot को किसी पृष्ठ को क्रॉल करने से रोकना, Googlebot को किसी पृष्ठ को अनुक्रमित करने से रोकना, और किसी पृष्ठ को दोनों क्रॉलर या उपयोगकर्ताओं द्वारा पूरी तरह से सुलभ नहीं होने देना अलग-अलग बातें हैं।
Googlebot की पुष्टि करना
Googlebot को रोकने का निर्णय लेने से पहले, आपको यह पता होना चाहिए कि Googlebot द्वारा उपयोग की जाने वाली उपयोगकर्ता एजेंट स्ट्रिंग अक्सर अन्य क्रॉलर्स द्वारा धोखा दी जाती है। यह सत्यापित करना महत्वपूर्ण है कि एक समस्या अनुरोध वास्तव में Google से आया है। एक अनुरोध का यह सत्यापित करने का सबसे अच्छा तरीका है कि वह वास्तव में Googlebot से आता है, अनुरोध के स्रोत IP पर एक रिवर्स DNS लुकअप का उपयोग करना, या स्रोत IP को Googlebot IP रेंज के खिलाफ मिलाना है।
Recent Comments