重複コンテンツとSEOの究極のガイド

公開: 2022-02-13

重複コンテンツとは、オンラインで複数の場所に表示されるコンテンツを指します。 「場所」とは、一意のURLを持つページを意味します。 まったく同じコンテンツでも、ほぼ同じコンテンツでもかまいません。また、同じWebサイトまたは別のサイトにある可能性もあります。

重複したコンテンツに対してGoogleから技術的に罰せられることはないかもしれませんが、検索エンジンのランキングに悪影響を与える可能性があります。 これは、検索エンジンがコンテンツのどの場所が最も関連性が高いかを判断するのが難しいためです。 その結果、どのURLも上位にランク付けされることはなく、単一のページで検索の可視性が最高になることはありません。

Googleは、重複するコンテンツを検出し、すべてのURLを1つのクラスターにグループ化して、最良の結果を選択できるはずです。 ただし、これは常に正しく機能するとは限らず、間違ったURLが選択される可能性があります。 最終的に、Webサイトの所有者は、コンテンツの重複により、ランキングの低下やトラフィックの減少に気付く可能性があります。 幸いなことに、この種のことがあなたのサイトで起こらないようにする方法があります。

重複コンテンツが問題になる理由

重複するコンテンツは、さまざまな方法で検索エンジンとサイト所有者に影響を与えます。

  • 検索エンジンは、どのURLをインデックスに含めるか含めないかを知りません。
  • 検索エンジンは、リンクメトリック(権限、信頼など)をすべて1つのページに送信するか、複数のページに送信するかを認識していません。
  • SERP(検索エンジンの結果ページ)でランク付けするURLが不明であり、望ましくないURLが正当なURLを上回る場合があります。
  • コンテンツへのバックリンクを含めたい他のサイトは複数のURLから選択する必要があるため、リンクの公平性(あるページが別のページに渡す権限と価値)は希薄になります。 リンクの公平性は、1ページだけに焦点を合わせるのではなく、複製全体に分散されます。

すべてがあなたのウェブサイトに直接つながるURLであっても、ユーザーにとって不親切に見えるリンク属性があり、Googleが元のURLではなくそのバージョンのURLをランク付けしている場合、ユーザーはそのURLをクリックしたくない場合があります。 たとえば、 yoursite.com / besttrailsは、 yoursite.com / besttrails /?utm_content = buffer&utm_medium=socialよりもはるかに魅力的に見えます。 しかし、Googleが重複コンテンツのプライマリバージョンであると考えて2番目にランク付けした場合、それは威圧的で信頼できないように見えるため、人々はそれをクリックしません。

また、コンテンツが重複していると、Webサイトのクロール「予算」が使い果たされます。 Googleはウェブサイトをクロールして新しいコンテンツを見つけます。また、Googleは定期的にサイトを再クロールして、何か新しいものがあるかどうかを確認します。 サイトに重複するコンテンツがある場合は、すべてのページを完全にクロールするのに時間がかかることを意味します。 そのため、Googleがページのインデックス作成と再インデックス作成を行い、検索結果に表示するまでのスケジュールが遅くなる可能性があります。

Googleの重複コンテンツポリシー

グーグルによると:

サイト上の重複コンテンツは、重複コンテンツの意図が欺瞞的で検索エンジンの結果を操作することであると思われる場合を除き、そのサイトでの行動の根拠にはなりません。

ただし、Googleは重複コンテンツのほとんどのインスタンスについてウェブサイトの所有者にペナルティを課しませんが、同社は続けて次のように述べています。

重複コンテンツがランキングを操作してユーザーを欺く目的で表示される可能性があるとGoogleが認識するまれなケースでは、関連するサイトのインデックス作成とランキングも適切に調整します。 その結果、サイトのランキングが低下したり、サイトがGoogleインデックスから完全に削除されたりする可能性があります。その場合、検索結果に表示されなくなります。

Googleは、ユーザーを欺いたり、検索エンジンのランキングを操作したりする意図をどのように考えているでしょうか。 意図的にドメイン、サブドメイン、および重複コンテンツを含むページを作成します。 また、スクレイピングされたコンテンツを公開します。特に、他に価値のあるものを追加しない場合はそうです。

ただし、これを覚えておいてください。Googleが公式にペナルティを科したり、重複コンテンツを悪意のあるものと見なしたりしない場合でも、SEOの取り組みに悪影響を与える可能性があります。 重複コンテンツの問題が原因でGoogleがサイトのランキングを停止した場合は、問題が修正されたら再審査リクエストを送信できます。

重複コンテンツがどのように発生するか

通常、Webサイトの所有者は、意図的に重複するコンテンツを作成することはありません。 そのため、Googleはそれほど大幅にペナルティを科しません。 これは、コピーされたコンテンツと複製されたコンテンツの違いでもあります。

コピーされたコンテンツとは、別のWebサイトから正確な表現を取り出して、自分で公開することです。 重複コンテンツとは、誤ってまたは無意識のうちに、オンラインの別の場所に自分のコンテンツの別のバージョンがある場合です。

ここでは、重複コンテンツがオンラインになる一般的な方法について説明します。 その後、重複コンテンツの問題を解決する方法について説明します。

HTTP、HTTPS、WWW、および非WWWページ

たとえば、サイトに2つの異なるバージョン( www.yoursite.comyoursite.com )がある場合、同じコンテンツが両方のバージョンのサイトに存在します。つまり、コンテンツが重複しています。 同じことがhttp://およびhttps://サイトにも当てはまります。

ページ付け

ページネーションは、ブログ投稿の1つの記事またはコメントセクションが複数のページにまたがる場合に発生する可能性があります。 または、画像のギャラリーがあり、それぞれが別のページにある場合もあります。 この種の重複は、ユーザーが下にスクロールし続けると新しいコンテンツが表示される無限スクロールのページでも発生する可能性があります。

URLバリエーション

トラッキングコードなどのURLパラメータは、意図せずに重複するコンテンツを作成する可能性があります。 たとえば、ウェブサイトのページはyoursite.com/sneakersですが、ユーザーがクリックした場所を確認するためのトラッキングコードがある場合は、 yoursite.com / newsletter?utm_source=newsletterのようになります。 Googleや他の検索エンジンがこの重複コンテンツを考慮しない場合でも、分析プラットフォームに複数のエントリを作成する個別のパラメータを処理する必要がある場合があります。

セッションIDも同じ効果があります。 セッションは、訪問者がショッピングカートに何かを追加したときなど、訪問者がWebサイトで行ったことの短い履歴です。 ユーザーがクリックして他のページに移動してもセッションは残り、カートはそのまま残ります。 セッションIDは、そのセッションの一意の修飾子であり、URL(yoursite.com?sessionId = jow8082345hnfn8456)に保存される場合があります。 これにより、同じページコンテンツで複数の異なるURLを作成できます。

コンテンツのプリンター対応バージョンまたはモバイル対応バージョンがある場合も、同じことが起こり得ます。 検索エンジンは、同じコンテンツのページが複数あると見なします。 なぜなら…あります。

これは、特にユーザーが検索結果をフィルタリングする場合に、eコマースWebサイトでもよく発生します。 URLはほぼ同じですが、サイズや色などの補足が最後にあります。 これは、ファセットナビゲーションまたはフィルター処理されたナビゲーションと呼ばれます。 ページの内容はほぼ同じですが、URLは一意です。

末尾のスラッシュでさえ、URLを一意にすることができます。 たとえば、 yoursite.com /pageとyoursite.com/page/です。 これが重複コンテンツの問題を引き起こしているかどうかを確認する最も簡単な方法は、ページの両方のバージョンに移動することです。 ロードされない場合は、心配する必要はありません。 それ以外の場合、リダイレクトはオプションです(これについては後で詳しく説明します)。

重複コンテンツが発生するその他の方法

  • Eコマース製品の説明:メーカーの製品説明を使用する場合、さまざまなEコマースサイトでコンテンツが重複するのが一般的です。
  • 画像の添付ファイルページ:各画像の添付ファイルに個別のページがある場合、重複するコンテンツが作成される可能性があります。
  • 検索結果ページ: yoursite.com?q= search-termのようなパラメータを検索URLに追加します。
  • ステージング環境:これは、テストに使用されるサイトの複製バージョンです。
  • タグとカテゴリのページ:タグまたはカテゴリを使用すると、WordPressは専用のタグとカテゴリのページを自動的に作成します。 これにより、1つのページに複数のカテゴリまたはタグがある場合にコンテンツが重複することがあります。

重複コンテンツを修正する方法

上記の小さな問題のいくつかについては、SEOプラグインに役立つ設定が見つかる場合があります。 たとえば、Yoastプラグインでは、画像の添付ページのURLを無効にできます。

重複コンテンツ

WordPressには、コメントのページネーションをオフにするための組み込みオプションもあります。

重複コンテンツ

それ以外の場合は、次の方法が重複コンテンツの問題を解決する主な方法です。

1.重複するコンテンツを見つける

まず、重複コンテンツのインスタンスを見つける必要があります。 AhrefsSiteAuditやGoogleSearchConsoleなどのツールは、サイトをクロールして、重複するコンテンツの警告があるかどうかを通知できます。

特定のキーワードについてサイトで重複するコンテンツを見つけようとしている場合は、次のように入力できます。

site:yoursite.com intitle:キーワード

次に、そのキーワードを含むWebサイト上のすべてのページが表示されます。 経験則として、特定のキーワードを検索して、結果を簡単に調べられるようにすることをお勧めします。

オンラインの他の場所で複製された特定の記事があると思われる場合は、GrammarlyやCopyscapeなどの盗用チェッカーを使用して、完全に一致する文の他のインスタンスを見つけることができます。 または、1〜2文全体をGoogleに貼り付けて、サイト以外の場所に表示されるかどうかを確認することもできます。

2.正規化によってコンテンツのURLを調整します

オンラインで重複するコンテンツがあることがわかったら、次に、どのページがメインのページであるかを判断します。

あなたは検索エンジンのためにそのプライマリページを正規化します。 正規化は、URLがページのマスターバージョンであることを検索エンジンに通知します。このページは、エンジンが遭遇する可能性のある重複ではなく、検索結果に表示される必要があります。 コンテンツを正規化する2つの方法は次のとおりです。

301リダイレクト

重複ページからメインページへの301リダイレクトを作成します。 重複したページは互いに競合しなくなり、メインページはより人気があり、関連性が高くなります。つまり、上位にランク付けされ始めます。 WordPressでリダイレクトを作成する方法についての記事があります。

また、リダイレクトされたURLが新しいターゲットに転送されることで、リンクジュース/ページ権限の追加のメリットも得られます。

Rel =” canonical”属性

この属性により、検索エンジンは、ページがURLのコピーであり、リンク、メトリック、およびランキングの検出力は、コピーされたページではなく、指定されたメインURLに適用される必要があることを認識できます。 属性は、フォーカスする元のページへのリンクとともに、各重複ページのHTMLヘッドに含める必要があります。 Googleには、属性を追加する方法について詳しく説明したドキュメントがあり、それを補足するために、正規URLとWordPressに関するより詳細なコンテンツがあります。

ボットがWebサイトのコンテンツをコピー、ダウンロード、および再投稿するときのコンテンツスクレイピングを回避するには、 rel =” canonical”属性を自分のWebページに追加します。 属性は自己参照型になります—現在のURLを指します。 コンテンツがスクレイプされたとしても、ボットが完全なHTMLコードを移植している限り、バージョンは元のバージョンと見なされます。

3.Google検索コンソールを使用してドメインURLを調整します

Google検索コンソールを使用すると、たとえばwww.yoursite.comではなくyoursite.comなど、Webサイトの優先ドメインを指定できます。 さまざまなURLパラメータを処理する方法をGooglebotに通知することもできます。 これにより、重複コンテンツの問題の一部またはすべてが解消される場合があります。 しかし、Googleでのみ。 他の検索エンジンではありません。 BingやYandexなどのプラットフォームには、独自のWebマスターツールがあります。

重複コンテンツを防止または修正するためのその他のヒント

  1. 内部リンクを追加するときは、たとえばwwwの有無にかかわらず、同じバージョンのドメインを使用します。 また、末尾のスラッシュの有無にかかわらず、常に同じバージョンのページを使用してください。 どの構造を選択するかは問題ではありませんが、一貫性があります。
  2. シンジケートコンテンツを手配する場合、そのコンテンツを使用しているWebサイトは、元のコンテンツへのバックリンクを追加する必要があります。 URLのバリエーションではありません。 ただし、元のメインの正規URL。
  3. 空のページをプレースホルダーとして公開しないでください。 空の各ページにインデックスが付けられるため、検索エンジンは重複するコンテンツがたくさんあると見なす可能性があります。
  4. 似ているコンテンツの量を減らします。 たとえば、合法的なWebサイトがあり、地域のさまざまな郡に対応しているとします。 人身傷害法など、同じ法律のトピックについて話している場合は、各郡固有のページに同様の情報が含まれている可能性があります。 1つのオプションは、両方の郡についてページをより大きなページにマージすることです。または、ページを分離しておくためにコンテンツをさらに変更することもできます。

重複コンテンツに関する最終的な考え

少量の重複コンテンツに出くわすことは、通常、心配する必要はありません。 しかし、数百または数千のページに影響を与える技術的な問題に対処する必要があります。 さらに、重複するコンテンツの問題をすべて解決しても問題はありません。 これは、整頓された高性能のサイトを運営することのほんの一部です。 結局のところ、あなたがしたい最後のことはあなた自身と競争し、あなたが完全にコントロールできるコンテンツのためにあなた自身のランキングを台無しにすることです。

重複するコンテンツを見つけたら、重複するキーワードの問題を防ぐためにキーワードの共食いを処理する方法についての記事を確認することもできます。

サイトの重複コンテンツをどのように処理しましたか? コメントで実際の戦略について話しましょう!

NikAndr/shutterstock.comによる記事特集画像