كيفية استخدام مدقق خرائط الموقع لاستكشاف الأخطاء وإصلاحها

نشرت: 2022-02-01

يمكن أن يوفر تقديم خريطة موقع XML لمحركات البحث تفصيلاً كاملاً لكل صفحة موقع تريد فهرستها. لذلك ، فهي خطوة أساسية في إستراتيجية تحسين محرك البحث (SEO). ومع ذلك ، للحصول على أفضل النتائج الممكنة ، ستحتاج إلى استخدام مدقق خرائط الموقع للتأكد من أنك لا ترسل ملفات بها أخطاء.

في هذه المقالة ، سنتحدث عن مدققي خرائط الموقع وكيفية عملها. ثم سنوجهك خلال الأخطاء الشائعة التي قد تواجهها عند استخدام مدقق خرائط الموقع وكيفية استكشافها وإصلاحها. دعنا نذهب اليها!

ما هو مدقق خريطة الموقع؟

ملف Sitemap هو ملف يحتوي على قائمة بكل عنوان URL على موقع الويب الخاص بك تريد أن تقوم محركات البحث بفهرسته. تأتي ملفات Sitemap بتنسيق XML أو HTML ، مع كون الأول هو الخيار الأكثر شيوعًا.

من الناحية الفنية ، لا تحتاج إلى إرسال خريطة موقع لموقع الويب الخاص بك إلى Google أو محركات البحث الأخرى. تستخدم هذه الأنظمة الأساسية برامج الزحف للتنقل في موقعك وتحديد كل عنوان URL وفهرسة تلك الصفحات. ومع ذلك ، يمنحك إنشاء ملف Sitemap تحكمًا كاملاً في عناوين URL التي تقوم بفهرستها محركات البحث وتلك التي لا يجب عليها (مثل المحتوى الخاص أو الزائد).

في معظم الحالات ، ستستخدم خرائط مواقع تم إنشاؤها تلقائيًا. إذا كنت تستخدم WordPress ، فيمكن أن تساعدك المكونات الإضافية لتحسين محركات البحث مثل Yoast في إنشاء خرائط مواقع يمكنك إرسالها إلى Google Search Console:

إعدادات خريطة موقع Yoast SEO

مدقق خرائط الموقع هو أداة يمكنها معالجة ملفات XML أو HTML والتأكد من عدم احتوائها على أخطاء. نعني بكلمة "أخطاء":

  • الصفحات التي لا تستطيع محركات البحث الزحف إليها
  • 404 أخطاء
  • 401 أخطاء
  • يوجد عدد كبير جدًا من عناوين URL في خريطة الموقع
  • عناوين URL غير المتعارف عليها

إذا كان ملف Sitemap الخاص بك يحتوي على أي من هذه الأخطاء ، فقد لا تتمكن محركات البحث من فهرسة كل صفحة تقوم بإدراجها. يمكن أن تستغرق قراءة ملفات XML يدويًا للعثور على المشكلات وقتًا طويلاً ، وتحتاج أيضًا إلى اختبار عناوين URL. لحسن الحظ ، تتيح لك أدوات التحقق من خرائط الموقع تخطي كل هذا العمل والبدء في إصلاح أي أخطاء يتم تحديدها.

كيفية استخدام مدقق خريطة الموقع

يعد استخدام مدقق خرائط الموقع أمرًا بسيطًا. بناءً على الأداة التي تستخدمها ، قد تحتاج إلى تحميل ملف XML أو تقديم عنوان URL لخريطة موقع الويب الخاص بك. يمكن تطبيق الخيار الأخير إذا كنت تستخدم أداة مثل مدقق خريطة موقع XML.

مدقق خريطة موقع XML

أدخل عنوان URL لملف Sitemap الذي تريد التحقق منه ، وستعرض الأداة تقريرًا يتضمن أي أخطاء تعثر عليها.

تقرير التحقق من XML

إذا تلقيت تقريرًا نظيفًا بدون مشاكل ، فيمكن لمحركات البحث فهرسة عناوين URL داخل خريطة الموقع. يمكنك إرسال خريطة الموقع بأمان إلى Google أو Bing أو Yandex أو في أي مكان تريده دون خوف. ومع ذلك ، إذا واجهت أخطاء ، فستحتاج إلى معرفة كيفية إصلاحها. هذا يقودنا إلى القسم التالي.

5 أخطاء خريطة الموقع الشائعة وكيفية إصلاحها

لسوء الحظ ، لا يتم التحقق من صحة بعض ملفات Sitemap تمامًا ، ولكننا سنغطي بعض الأخطاء الأكثر شيوعًا التي يمكن أن يجدها مدققو ملفات Sitemap في الملفات التي ترسلها إليهم. لنبدأ بمناقشة الصفحات التي تحتوي على "مشكلات" الزحف.

1. الصفحات التي بها مشكلات في الزحف

تعد مشكلات الزحف من أكثر المشكلات شيوعًا التي ستعرضها المدققون. يعني هذا الخطأ أن الخدمة لا يمكنها الزحف إلى إحدى الصفحات الموجودة في خريطة موقعك.

بشكل عام ، عندما يتعذر على المدقق أو محرك البحث الزحف إلى صفحة ، فهذا يعني أحد السيناريوهات التالية:

  • الصفحة تستغرق وقتا طويلا للتحميل. إذا استغرق تحميل موقعك على الويب وقتًا طويلاً ، فستنتهي مهلة الاتصال بالزاحف. هذا يعني أن بعض الصفحات قد لا تتم فهرستها.
  • يستخدم موقع الويب الخاص بك عمليات إعادة توجيه كثيرة جدًا. عندما لا يتم إعداد عمليات إعادة التوجيه بشكل صحيح ، يمكن أن ينتهي الأمر بموقعك في حلقة إعادة توجيه. هذا يعني أن محركات البحث لن تتمكن من الزحف إليها.
  • يمنع موقع الويب محركات البحث من الزحف إليه. يمكنك تكوين WordPress لحظر برامج الزحف (باستخدام علامات noindex ) بحيث لا يتم فهرسة موقع الويب الخاص بك. عادة ، يمكنك القيام بذلك أثناء بناء موقعك أو إنشاء صفحات خاصة.
  • تعرض الصفحة رمز خطأ بخلاف 404 أو 401. يمكن لمدققي ملفات Sitemap تحليل أخطاء 404. ومع ذلك ، ستؤدي رموز خطأ HTTP الأخرى إلى ظهور تحذير بشأن "مشكلة في الزحف".

يمكن أن يكون خطأ "مشكلات الزحف" غامضًا. ومع ذلك ، يمكنك تحديد المشكلة بدقة من خلال زيارة عنوان URL المعني. إذا تم تحميل الصفحة بسرعة وبشكل صحيح ، فقد يحظر موقع الويب الخاص بك محركات البحث من الزحف إليها.

إذا تم تحميل الصفحة بدون أخطاء ، فإننا نوصي باختبار أوقات تحميل موقع الويب الخاص بك لمعرفة ما إذا كانت هناك مشكلات في الأداء. وإلا ، فمن المفترض أن ترى رموز خطأ محددة أو حالات إعادة توجيه متعددة.

2. 404 أخطاء

من السهل حل أخطاء 404 في خريطة الموقع. إذا لم تعد الصفحة موجودة ، يمكنك إزالة هذا الإدخال من خريطة الموقع يدويًا أو إعداد إعادة توجيه لها. سيعتمد الخيار الأفضل بالنسبة لك على ما إذا كانت هذه الصفحة لا تزال تحصل على زيارات أم لا.

ستكشف تحليلات موقع الويب من Google Search Console والخدمات الأخرى ما إذا كانت صفحة 404 لا تزال تستقبل الزوار. في هذا السيناريو ، فإن أفضل رهان لك هو إعداد إعادة توجيه إلى أقرب صفحة أو منشور ذي صلة حتى لا تفوتك هذه الزيارات. طالما أنك تستخدم عملية إعادة توجيه واحدة ، فلن ينتج عنها خطأ في التحقق من صحة ملف Sitemap.

3. 401 أخطاء

خطأ 401 "غير مصرح به" في ملف Sitemap يعني أن برامج الزحف لا يمكنها الوصول إلى صفحة معينة لأنها لا تمتلك الأذونات اللازمة. يظهر هذا الخطأ عادةً عندما تتعامل مع صفحة تتطلب من المستخدمين تسجيل الدخول.

خطأ غير مصرح به 401

الحل الوحيد لهذا الخطأ هو إزالة الصفحات التي تتطلب إذنًا من خريطة الموقع. يجب عدم فهرسة أي صفحة يستطيع المستخدمون الذين قاموا بتسجيل الدخول فقط رؤيتها. بخلاف ذلك ، سيجد الزائرون الذين ينقرون عليها في صفحات نتائج محركات البحث (SERPs) أنفسهم يواجهون خطأ 401.

4. عناوين URL كثيرة جدًا في ملف Sitemap

يمكن لمحركات البحث الزحف إلى مواقع الويب الضخمة التي تحتوي على آلاف الصفحات. ومع ذلك ، في تجربتنا ، تبدأ خرائط المواقع في عرض الأخطاء إذا قمت بإدراجها في أي مكان بالقرب من (أو أكثر) 50000 صفحة.

إذا كان هذا هو الوضع الخاص بك ، ثم مجد لهذا الجهد. 50000 صفحة عدد كبير . ومع ذلك ، من المحتمل أن تحتوي معظم مواقع الويب التي تحتوي على أكثر من 50000 صفحة على عناوين URL متعددة من محتوى من إنشاء المستخدمين. في هذا السيناريو ، تريد تحديد أولويات الصفحات الأكثر أهمية على موقعك أثناء إزالة إدخالات خريطة الموقع التي قد لا يرغب المستخدمون في رؤيتها في SERPs.

5. عناوين URL غير المتعارف عليها في ملف Sitemap

في بعض الأحيان ، قد يتم الخلط بين محركات البحث عندما ترى إصدارات متعددة من عنوان URL للصفحة نفسها. على سبيل المثال ، قد تتمكن من الوصول إلى صفحة مدونة بسيطة باستخدام أي من عناوين URL التالية:

  • http://yourwebsite.com
  • http://www.yourwebsite.com
  • https://yourwebsite.com
  • https://www.yourwebsite.com

من الناحية العملية ، يمكن أن تؤدي جميع عناوين URL هذه إلى نفس الصفحة (إذا قمت بإعادة توجيه حركة مرور HTTP إلى HTTPS). ومع ذلك ، قد ترى محركات البحث عناوين URL هذه كأربعة إدخالات مختلفة في ملف Sitemap ، مما يؤدي إلى حدوث أخطاء في التحقق من الصحة.

تتمثل الطريقة البسيطة لحل هذه المشكلة في تعيين عنوان URL أساسي لموقع الويب الخاص بك على WordPress. ستعمل مكونات تحسين محركات البحث (SEO) مثل Yoast على تعيين عناوين URL أساسية لموقعك تلقائيًا. إذا كنت تستخدم ملف XML تم إنشاؤه بواسطة مكون إضافي لتحسين محركات البحث ، فلا يجب أن تواجه الخطأ "غير المتعارف عليه" عند استخدام مدقق خرائط الموقع.

خاتمة

مع نمو موقع الويب الخاص بك ، يصبح استخدام خريطة الموقع أكثر أهمية. تتيح لك خرائط المواقع إخبار محركات البحث بالصفحات التي يجب فهرستها والصفحات التي يجب تجاهلها. علاوة على ذلك ، سيساعدك استخدام مدقق خرائط الموقع على اكتشاف الأخطاء حتى لا تواجه برامج الزحف مشكلات أثناء فهرسة موقع الويب الخاص بك.

للتلخيص ، فإن الأخطاء الخمسة الأكثر شيوعًا التي قد تصادفها باستخدام مدقق خرائط الموقع هي:

  1. الصفحات التي بها مشكلات في الزحف: ستحتاج إلى التحقق من أوقات التحميل وعمليات إعادة التوجيه وزيارة صفحة موقع الويب لتحديد المشكلة بالضبط.
  2. أخطاء 404: يعني هذا الخطأ أنه يجب عليك حذف الصفحة غير الموجودة من خريطة الموقع أو إعداد إعادة توجيه لها.
  3. أخطاء 401: ضع في اعتبارك إزالة الصفحات المقيدة من ملف Sitemap الخاص بك.
  4. عدد كبير جدًا من عناوين URL في خريطة الموقع: قد تحتاج إلى أن تكون انتقائيًا بشأن الصفحات الموجودة في ملف Sitemap وإزالة الصفحات الأقل فائدة.
  5. عناوين URL غير المتعارف عليها في خريطة الموقع: نوصي بإعداد عنوان URL أساسي لصفحات معينة.

هل لديك أي أسئلة حول استخدام مدقق خرائط الموقع؟ دعنا نتحدث عنها في قسم التعليقات أدناه!

صورة مميزة عبر hanss / shutterstock.com