Der ultimative Leitfaden für Duplicate Content und SEO
Veröffentlicht: 2022-02-13Duplicate Content bezieht sich auf Inhalte, die an mehr als einer Stelle online erscheinen. Mit „Ort“ meinen wir eine Seite mit einer eindeutigen URL. Es kann genau derselbe Inhalt oder fast genau derselbe sein, und er kann sich auf derselben Website oder auf einer anderen Website befinden.
Sie werden – technisch gesehen – von Google möglicherweise nicht für doppelte Inhalte bestraft, aber es kann Ihrem Suchmaschinenranking schaden. Das liegt daran, dass es für Suchmaschinen schwierig ist, herauszufinden, welche Stelle des Inhalts am relevantesten ist. Infolgedessen erhält keine der URLs ein hohes Ranking und keine einzelne Seite erhält die höchstmögliche Sichtbarkeit in den Suchergebnissen.
Google soll in der Lage sein, Duplicate Content zu erkennen, alle URLs in einem Cluster zu gruppieren und dann das beste Ergebnis auszuwählen. Dies funktioniert jedoch nicht immer richtig, und es kann vorkommen, dass die falsche URL ausgewählt wird. Letztendlich können Website-Besitzer aufgrund von Duplicate Content niedrigere Rankings oder weniger Traffic feststellen. Glücklicherweise gibt es Möglichkeiten, um zu verhindern, dass solche Dinge auf Ihren Websites passieren.
Warum Duplicate Content ein Problem ist
Duplicate Content wirkt sich auf verschiedene Weise auf Suchmaschinen und Websitebesitzer aus:
- Suchmaschinen wissen nicht, welche URLs in Indizes aufgenommen oder nicht aufgenommen werden sollen.
- Suchmaschinen wissen nicht, ob Linkmetriken (Autorität, Vertrauen usw.) alle auf eine Seite oder auf mehrere Seiten geleitet werden sollten.
- Es ist unklar, welche URL in SERPs (Suchmaschinen-Ergebnisseiten) platziert werden soll, und manchmal kann die unerwünschte URL die legitime übertreffen.
- Link Equity (die Autorität und der Wert, den eine Seite an eine andere weitergibt) wird verwässert, da andere Websites, die einen Backlink zu den Inhalten einfügen möchten, zwischen den mehreren URLs wählen müssen. Der Linkwert wird dann über die Duplikate verteilt, anstatt sich nur auf eine Seite zu konzentrieren.
Selbst bei URLs, die alle auf Ihre Website verweisen, möchten die Leute möglicherweise nicht darauf klicken, wenn Linkattribute vorhanden sind, die sie für Benutzer unfreundlich aussehen lassen, und Google diese Version der URL anstelle des Originals einstuft. Beispielsweise sieht yoursite.com/besttrails viel einladender aus als yoursite.com/besttrails/?utm_content=buffer&utm_medium=social . Aber wenn Google den zweiten Platz einnimmt, weil es denkt, dass dies die primäre Version des doppelten Inhalts ist, werden die Leute nicht darauf klicken, weil es einschüchternd und nicht vertrauenswürdig aussieht.
Außerdem wird das Crawl-"Budget" Ihrer Website aufgebraucht, wenn Sie Duplicate Content haben. Google crawlt Websites, um neue Inhalte zu finden, und Google crawlt Websites regelmäßig erneut, um zu sehen, ob es etwas Neues gibt. Wenn auf Ihrer Website duplizierter Inhalt vorhanden ist, dauert es länger, alle Seiten gründlich zu crawlen. Das kann zu einem langsameren Zeitplan für Google führen, um Seiten zu indizieren und neu zu indizieren und sie in den Suchergebnissen anzuzeigen.
Duplicate Content Policy von Google
Laut Google:
Doppelte Inhalte auf einer Website sind kein Grund für Maßnahmen auf dieser Website, es sei denn, es scheint, dass die Absicht der doppelten Inhalte darin besteht, zu täuschen und Suchmaschinenergebnisse zu manipulieren.
Obwohl Google Websitebesitzer für die meisten Fälle von doppeltem Inhalt nicht bestraft, fährt das Unternehmen fort:
In den seltenen Fällen, in denen Google erkennt, dass Duplicate Content mit der Absicht angezeigt wird, unser Ranking zu manipulieren und unsere Nutzer zu täuschen, werden wir auch entsprechende Anpassungen bei der Indexierung und dem Ranking der betroffenen Websites vornehmen. Dadurch kann das Ranking der Seite leiden oder die Seite ganz aus dem Google-Index entfernt werden, wodurch sie nicht mehr in den Suchergebnissen auftaucht.
Was könnte Google als Absicht betrachten, Benutzer zu täuschen und/oder Suchmaschinenrankings zu manipulieren? Absichtlich Domains, Subdomains und Seiten mit Duplicate Content erstellen. Auch das Veröffentlichen von abgekratzten Inhalten – insbesondere, wenn Sie nichts anderes Wertvolles hinzufügen.
Denken Sie jedoch daran: Auch wenn Google Sie nicht offiziell bestraft oder Ihren doppelten Inhalt als bösartig betrachtet, kann dies Ihren SEO-Bemühungen schaden. Wenn Google das Ranking Ihrer Website aufgrund von Problemen mit doppelten Inhalten eingestellt hat, können Sie einen Antrag auf erneute Überprüfung stellen, sobald die Probleme behoben wurden.
Wie es zu Duplicate Content kommt
Normalerweise erstellt ein Website-Eigentümer nicht absichtlich doppelte Inhalte. Deshalb bestraft Google es nicht zu drastisch. Das ist auch der Unterschied zwischen kopiertem Inhalt und doppeltem Inhalt .
Von kopierten Inhalten spricht man, wenn Sie den genauen Wortlaut von einer anderen Website übernehmen und ihn selbst veröffentlichen. Duplicate Content liegt vor, wenn Sie versehentlich oder unwissentlich eine andere Version Ihrer eigenen Inhalte irgendwo anders online haben.
Hier gehen wir auf gängige Wege ein, auf denen duplizierte Inhalte online landen. Danach werden wir darüber sprechen, wie man das Problem des doppelten Inhalts löst.
HTTP-, HTTPS-, WWW- und Nicht-WWW-Seiten
Wenn Ihre Website zwei verschiedene Versionen hat – beispielsweise www.yoursite.com und yoursite.com – wird derselbe Inhalt auf beiden Versionen der Website vorhanden sein, was bedeutet, dass es doppelte Inhalte gibt. Dasselbe gilt für http://- und https://- Sites.
Seitennummerierung
Paginierung kann vorkommen, wenn ein Artikel oder der Kommentarbereich eines Blogbeitrags mehrere Seiten umfasst. Oder vielleicht gibt es eine Bildergalerie mit jedem auf einer separaten Seite. Diese Art der Duplizierung kann auch auf einer Seite mit unendlichem Scrollen auftreten, auf der neue Inhalte aufgefüllt werden, während der Benutzer weiter nach unten scrollt.
URL-Variationen
URL-Parameter wie Tracking-Codes können unbeabsichtigt doppelte Inhalte erstellen. Eine Seite auf Ihrer Website kann zum Beispiel yoursite.com/sneakers sein, aber wenn Sie einen Tracking-Code haben, um zu sehen, von wo aus die Besucher geklickt haben, könnte er wie yoursite.com/newsletter?utm_source=newsletter aussehen. Auch wenn Google und andere Suchmaschinen diesen doppelten Inhalt nicht berücksichtigen, müssen Sie sich möglicherweise auch mit den separaten Parametern auseinandersetzen, die mehrere Einträge in Ihren Analyseplattformen erstellen.
Sitzungs-IDs können denselben Effekt haben. Eine Sitzung ist ein kurzer Verlauf dessen, was ein Besucher auf einer Website tut, z. B. wenn er etwas in seinen Einkaufswagen legt. Die Sitzung bleibt bestehen, wenn sich die Person zu anderen Seiten durchklickt, sodass ihr Einkaufswagen intakt bleibt. Die Sitzungs-ID ist der eindeutige Modifikator für diese Sitzung und wird manchmal in der URL gespeichert (yoursite.com?sessionId=jow8082345hnfn8456). Dadurch können mehrere verschiedene URLs mit demselben Seiteninhalt erstellt werden.
Dasselbe kann passieren, wenn Sie eine druckerfreundliche Version oder eine für Mobilgeräte optimierte Version des Inhalts haben. Suchmaschinen werden denken, dass es mehrere Seiten mit demselben Inhalt gibt. Weil dort sind.
Dies kommt auch häufig auf E-Commerce-Websites vor, insbesondere wenn Benutzer Suchergebnisse filtern. Die URL bleibt ungefähr gleich, aber mit einem Zusatz am Ende, wie der Größe oder Farbe. Dies wird als facettierte oder gefilterte Navigation bezeichnet. Der Inhalt auf den Seiten ist nahezu gleich, aber die URLs sind einzigartig.
Auch abschließende Schrägstriche können eine URL eindeutig machen. Beispiel: yoursite.com/page und yoursite.com/page/ . Der schnellste Weg, um festzustellen, ob dies ein Problem mit doppelten Inhalten verursacht, besteht darin, beide Versionen einer Seite aufzurufen. Wenn einer nicht geladen wird, müssen Sie sich keine Sorgen machen. Andernfalls ist eine Umleitung eine Option (dazu gleich mehr).

Mehr Möglichkeiten für doppelte Inhalte
- E-Commerce-Produktbeschreibungen: Es ist üblich, dass verschiedene E-Commerce-Websites doppelte Inhalte haben, wenn sie die Herstellerbeschreibung eines Produkts verwenden.
- Seiten mit Bildanhängen: Wenn jeder Bildanhang eine separate Seite hat, kann dies zu doppelten Inhalten führen.
- Suchergebnisseiten: Diese fügen der Such-URL einen Parameter hinzu, wie yoursite.com?q=search-term .
- Staging-Umgebung: Dies ist eine duplizierte Version Ihrer Website, die zum Testen verwendet wird.
- Tag- und Kategorieseiten: Wenn Sie ein Tag oder eine Kategorie verwenden, erstellt WordPress automatisch dedizierte Tag- und Kategorieseiten. Dies kann manchmal zu Duplicate Content führen, wenn eine Seite mehrere Kategorien oder Tags hat.
So beheben Sie doppelte Inhalte
Für einige der oben aufgeführten kleineren Probleme finden Sie möglicherweise eine Einstellung in Ihrem SEO-Plugin, die Ihnen helfen wird. Im Yoast-Plug-in können Sie beispielsweise URLs von Anhangsseiten für Bilder deaktivieren:
WordPress hat auch eine eingebaute Option zum Deaktivieren der Paginierung von Kommentaren:
Ansonsten sind die folgenden Praktiken jedoch die wichtigsten Möglichkeiten, um Probleme mit doppelten Inhalten zu lösen.
1. Finden Sie den doppelten Inhalt
Zuerst müssen Sie Instanzen von Duplicate Content finden. Tools wie das Ahrefs Site Audit und die Google Search Console können Ihre Website crawlen und Sie informieren, wenn es Warnungen zu doppelten Inhalten gibt.
Wenn Sie versuchen, Duplicate Content auf Ihrer Website für ein bestimmtes Keyword zu finden, können Sie dies in Google eingeben:
site:ihresite.com intitle: Schlüsselwort
Sie sehen dann alle Seiten Ihrer Website, die dieses Keyword enthalten. Eine gute Faustregel ist, nach einem bestimmten Schlüsselwort zu suchen, damit die Ergebnisse einfacher durchkämmt werden können.
Wenn Sie glauben, dass es einen bestimmten Artikel gibt, der an anderer Stelle online dupliziert wurde, können Sie einen Plagiatsprüfer wie Grammarly oder Copyscape verwenden, um andere Instanzen von Sätzen mit exakter Übereinstimmung zu finden. Oder Sie können einen oder zwei ganze Sätze in Google einfügen, um zu sehen, ob sie irgendwo anders als auf Ihrer Website angezeigt werden.
2. Passen Sie die URL des Inhalts durch Kanonisierung an
Sobald Sie wissen, dass online Duplicate Content vorhanden ist, ist es an der Zeit zu bestimmen, welche Seite die Hauptseite ist.
Sie kanonisieren diese Primärseite für Suchmaschinen. Die Kanonisierung teilt Suchmaschinen mit, dass eine URL eine Master-Version einer Seite ist – dass diese Seite in den Suchergebnissen erscheinen sollte und nicht in Duplikaten, auf die die Suchmaschine stoßen könnte. Hier sind zwei Möglichkeiten, Inhalte zu kanonisieren:
301-Umleitung
Erstellen Sie eine 301-Weiterleitung von der/den doppelten Seite(n) zur Hauptseite. Die doppelten Seiten konkurrieren nicht mehr miteinander, und die Hauptseite wird beliebter und relevanter, was bedeutet, dass sie einen höheren Rang einnimmt. Wir haben einen Artikel darüber, wie man Weiterleitungen mit WordPress erstellt, um Ihnen zu helfen.
Sie erhalten auch den zusätzlichen Vorteil von Linkjuice/Seitenautorität, wenn die umgeleitete URL auch auf das neue Ziel übertragen wird.
Rel="kanonisches" Attribut
Dieses Attribut teilt Suchmaschinen mit, dass eine Seite eine Kopie einer URL ist und dass alle Links, Metriken und Ranking-Power auf die angegebene Haupt-URL und nicht auf die kopierte Seite angewendet werden sollten. Das Attribut sollte im HTML-Kopf jeder doppelten Seite mit einem Link zur Originalseite, auf der Sie den Fokus haben möchten, enthalten sein. Google hat eine Dokumentation, die ausführlich erklärt, wie man das Attribut hinzufügt, und wir haben detailliertere Inhalte zu kanonischen URLs und WordPress, um das zu ergänzen.
Um das Scraping von Inhalten zu vermeiden, d. h. wenn Bots Ihre Website-Inhalte kopieren, herunterladen und erneut veröffentlichen, fügen Sie das Attribut rel="canonical" zu Ihren eigenen Webseiten hinzu. Das Attribut ist selbstreferenziell – es zeigt auf die URL, auf der es sich gerade befindet. Selbst wenn der Inhalt gekratzt wird, wird Ihre Version immer noch als das Original betrachtet, solange die Bots den vollständigen HTML-Code portieren.
3. Passen Sie Ihre Domain-URLs mit der Google Search Console an
Mit der Google Search Console können Sie die bevorzugte Domain Ihrer Website festlegen, z. B. yoursite.com anstelle von www.yoursite.com . Sie können dem Googlebot auch mitteilen, wie er mit verschiedenen URL-Parametern umgehen soll. Dadurch können einige oder alle Ihrer Probleme mit doppelten Inhalten behoben werden. Aber nur mit Google. Nicht mit anderen Suchmaschinen. Plattformen wie Bing und Yandex haben ihre eigenen Webmaster-Tools.
Weitere Tipps zum Verhindern oder Beheben von Duplicate Content
- Verwenden Sie beim Hinzufügen interner Links dieselbe Version der Domain, z. B. mit oder ohne www . Verwenden Sie außerdem immer dieselbe Version einer Seite mit oder ohne abschließenden Schrägstrich. Es spielt keine Rolle, welche Struktur Sie wählen, aber bleiben Sie dabei konsequent.
- Wenn Sie syndizierte Inhalte arrangieren, sollte die Website, die die Inhalte verwendet, einen Backlink zu den ursprünglichen Inhalten hinzufügen. Keine Variation der URL. Aber die ursprüngliche, kanonische Haupt-URL.
- Veröffentlichen Sie keine leeren Seiten als Platzhalter. Jede leere Seite wird indiziert, wodurch die Suchmaschine glauben kann, dass Sie viele doppelte Inhalte haben.
- Reduzieren Sie, wie viele ähnliche Inhalte Sie haben. Nehmen wir zum Beispiel an, Sie haben eine legale Website und beliefern verschiedene Bezirke in Ihrer Nähe. Jede landesspezifische Seite kann ähnliche Informationen enthalten, wenn Sie über dasselbe Rechtsthema sprechen, z. B. Personenschadensrecht. Eine Möglichkeit besteht darin, die Seite zu einer größeren Seite über beide Landkreise zusammenzuführen, oder Sie können den Inhalt stärker variieren, um die Seiten getrennt zu halten.
Abschließende Gedanken zu Duplicate Content
Auf eine kleine Menge doppelter Inhalte zu stoßen, ist normalerweise kein Grund zur Sorge. Aber technische Probleme, die Hunderte oder Tausende von Seiten betreffen, müssen behandelt werden. Außerdem schadet es nicht, alle Probleme mit doppelten Inhalten zu beseitigen. Das gehört zum Betrieb einer übersichtlichen und leistungsstarken Website einfach dazu. Schließlich möchten Sie auf keinen Fall mit sich selbst konkurrieren und Ihr eigenes Ranking ruinieren, weil Sie die vollständige Kontrolle über Inhalte haben.
Sobald Sie Duplicate Content herausgefunden haben, sollten Sie sich auch unseren Artikel über den Umgang mit Kannibalisierung von Keywords ansehen, um Probleme mit doppelten Keywords zu vermeiden.
Wie haben Sie es geschafft, mit doppelten Inhalten auf Ihren Websites umzugehen? Lass uns in den Kommentaren über reale Strategien sprechen!
Beitragsbild des Artikels von NikAndr/shutterstock.com