サイトマップバリデーターを使用してエラーをトラブルシューティングする方法

公開: 2022-02-01

XMLサイトマップを送信すると、検索エンジンに、インデックスを作成するすべてのWebサイトページの完全な内訳を提供できます。 したがって、これは検索エンジン最適化(SEO)戦略の重要なステップです。 ただし、最良の結果を得るには、サイトマップバリデーターを使用して、エラーのあるファイルを送信していないことを確認する必要があります。

この記事では、サイトマップバリデーターとは何か、そしてそれらがどのように機能するかについて説明します。 次に、サイトマップバリデーターを使用するときに発生する可能性のある一般的なエラーと、それらのトラブルシューティング方法について説明します。 それを手に入れよう!

サイトマップバリデーターとは何ですか?

サイトマップは、検索エンジンでインデックスを作成するWebサイト上のすべてのURLのリストを含むファイルです。 サイトマップはXMLまたはHTML形式で提供され、前者が最も一般的なオプションです。

技術的には、ウェブサイトのサイトマップをGoogleや他の検索エンジンに送信する必要はありません。 これらのプラットフォームは、クローラーを使用してサイトをナビゲートし、すべてのURLを識別し、それらのページにインデックスを付けます。 ただし、サイトマップを作成すると、検索エンジンがインデックスを作成するURLとインデックスを作成しないURL(プライベートコンテンツや冗長コンテンツなど)を完全に制御できます。

ほとんどの場合、自動生成されたサイトマップを利用します。 WordPressを使用している場合、YoastなどのSEOプラグインは、Google検索コンソールに送信できるサイトマップの作成に役立ちます。

YoastSEOサイトマップ設定

サイトマップバリデーターは、これらのXMLまたはHTMLファイルを処理し、エラーが含まれていないことを確認できるツールです。 「エラー」とは、次のことを意味します。

  • 検索エンジンがクロールできないページ
  • 404エラー
  • 401エラー
  • サイトマップのURLが多すぎます
  • 非正規URL

サイトマップにこれらのエラーのいずれかが含まれている場合、検索エンジンはリストされているすべてのページにインデックスを付けることができない可能性があります。 XMLファイルを手動で読み取って問題を見つけるには長い時間がかかる可能性があり、URLもテストする必要があります。 幸い、サイトマップバリデーターを使用すると、すべての作業をスキップして、特定したエラーの修正を開始できます。

サイトマップバリデーターの使用方法

サイトマップバリデーターの使用は簡単です。 使用するツールによっては、XMLファイルをアップロードするか、WebサイトのサイトマップへのURLを提供する必要がある場合があります。 後者のオプションは、XMLサイトマップバリデーターなどのツールを使用する場合に適用できます。

XMLサイトマップバリデーター

確認するサイトマップのURLを入力すると、ツールは検出したエラーを含むレポートを返します。

XML検証レポート

問題のないクリーンなレポートを取得した場合、検索エンジンはサイトマップ内のURLにインデックスを付けることができます。 サイトマップは、Google、Bing、Yandexなど、どこにでも安全に送信できます。 ただし、エラーが発生した場合は、それらを修正する方法を知っておく必要があります。 次のセクションに進みます。

5つの一般的なサイトマップエラーとその修正方法

残念ながら、一部のサイトマップは完全に検証されませんが、サイトマップバリデーターが送信するファイルで検出される可能性のある最も一般的なエラーのいくつかについて説明します。 クロールする「問題」のあるページについて説明することから始めましょう。

1.クロールの問題があるページ

クロールの問題は、バリデーターが返す最も一般的な問題の1つです。 このエラーは、サービスがサイトマップのページの1つをクロールできなかったことを意味します。

一般に、バリデーターまたは検索エンジンがページをクロールできない場合は、次のいずれかのシナリオを意味します。

  • ページの読み込みに時間がかかりすぎます。 ウェブサイトの読み込みに時間がかかりすぎると、クローラーとの接続がタイムアウトになります。 つまり、一部のページはインデックスに登録されない可能性があります。
  • あなたのウェブサイトはあまりにも多くのリダイレクトを使用しています。 リダイレクトが正しく設定されていないと、Webサイトがリダイレクトループに陥る可能性があります。 つまり、検索エンジンはそれをクロールできなくなります。
  • ウェブサイトは検索エンジンがそれをクロールするのをブロックしています。 Webサイトがインデックスに登録されないように( noindexタグを使用して)クローラーをブロックするようにWordPressを構成できます。 通常、これはサイトの構築中またはプライベートページの作成中に行います。
  • ページは404または401以外のエラーコードを返します。サイトマップバリデーターは404エラーを解析できます。 ただし、他のHTTPエラーコードは「クロールの問題」の警告になります。

「クロールの問題」エラーはあいまいになる可能性があります。 ただし、問題のURLにアクセスすることで、正確な問題を特定できます。 ページがすばやく正しく読み込まれる場合は、ウェブサイトが検索エンジンによるページのクロールをブロックしている可能性があります。

ページがエラーなしで読み込まれる場合は、Webサイトの読み込み時間をテストして、パフォーマンスの問題があるかどうかを確認することをお勧めします。 それ以外の場合は、特定のエラーコードまたは複数のリダイレクトのインスタンスが表示されます。

2.404エラー

サイトマップの404エラーは簡単に解決できます。 ページが存在しなくなった場合は、そのエントリをサイトマップから手動で削除するか、リダイレクトを設定できます。 あなたにとって最良の選択肢は、そのページがまだトラフィックを獲得しているかどうかによって異なります。

Google Search Consoleおよびその他のサービスからのWebサイト分析により、404ページがまだ訪問者を受け入れているかどうかが明らかになります。 そのシナリオでは、そのトラフィックを逃さないように、最も近い関連ページまたは投稿へのリダイレクトを設定するのが最善の策です。 単一のリダイレクトを使用する限り、サイトマップ検証エラーは発生しません。

3.401エラー

サイトマップの401「無許可」エラーは、クローラーが必要な権限を持っていないために特定のページにアクセスできないことを意味します。 このエラーは通常、ユーザーがログインする必要のあるページを扱っているときにポップアップします。

401の不正エラー

このエラーの唯一の解決策は、認証が必要なページをサイトマップから削除することです。 ログインしたユーザーだけが見ることができるページは、インデックスに登録されるべきではありません。 そうしないと、検索エンジンの結果ページ(SERP)でクリックした訪問者は、401エラーに直面することになります。

4.サイトマップのURLが多すぎます

検索エンジンは、数千ページの大規模なWebサイトをクロールできます。 ただし、私たちの経験では、50,000ページの近く(またはそれ以上)にリストすると、サイトマップにエラーが表示され始めます。

それがあなたの状況であるならば、それから努力のための称賛。 50,000ページはたくさんあります。 ただし、50,000ページを超えるほとんどのWebサイトには、ユーザーが生成したコンテンツからの複数のURLが含まれている可能性があります。 そのシナリオでは、ユーザーがSERPに表示したくないサイトマップエントリを削除しながら、サイトで最も重要なページに優先順位を付ける必要があります。

5.サイトマップの非正規URL

同じページに複数のバージョンのURLが表示されると、検索エンジンが混乱する場合があります。 たとえば、次のURLのいずれかを使用して簡単なブログページにアクセスできる場合があります。

  • http://yourwebsite.com
  • http://www.yourwebsite.com
  • https://yourwebsite.com
  • https://www.yourwebsite.com

実際には、これらのURLはすべて同じページにつながる可能性があります(HTTPトラフィックをHTTPSにリダイレクトする場合)。 ただし、検索エンジンはこれらのURLをサイトマップ内の4つの異なるエントリと見なし、検証エラーを引き起こす可能性があります。

この問題を解決する簡単な方法は、WordPressWebサイトの正規URLを指定することです。 YoastなどのSEOプラグインは、サイトの正規URLを自動的に割り当てます。 SEOプラグインによって生成されたXMLファイルを使用している場合、サイトマップバリデーターを使用するときに「非正規」エラーが発生することはありません。

結論

Webサイトが成長するにつれて、サイトマップの使用がより重要になります。 サイトマップを使用すると、検索エンジンにインデックスを作成するページと無視するページを指定できます。 さらに、サイトマップバリデーターを使用すると、エラーを特定して、Webサイトのインデックス作成中にクローラーが問題に遭遇しないようにすることができます。

要約すると、サイトマップバリデーターで発生する可能性のある最も一般的な5つのエラーは次のとおりです。

  1. クロールの問題があるページ:読み込み時間とリダイレクトを確認し、Webサイトのページにアクセスして、正確な問題を特定する必要があります。
  2. 404エラー:このエラーは、存在しないページをサイトマップから削除するか、リダイレクトを設定する必要があることを意味します。
  3. 401エラー:サイトマップから制限されたページを削除することを検討してください。
  4. サイトマップのURLが多すぎる:サイトマップのページを選択して、役に立たないページを削除する必要がある場合があります。
  5. サイトマップの非正規URL:特定のページに正規URLを設定することをお勧めします。

サイトマップバリデーターの使用について質問がありますか? 以下のコメントセクションでそれらについて話しましょう!

hanss/shutterstock.com経由の注目の画像