Was ist Duplicate Content?

Duplicate Content sind Inhalte, welche identisch oder sehr ähnlich auf mehreren URLs  vorkommen, sodass Suchmaschinen wie Google Probleme haben zu verstehen, auf welcher Seite es sich jetzt wirklich um ein Thema handelt und welche Seite relevant für den Suchenden ist. Schließlich braucht jede Unterseite genügend „unique Content“, also einzigartige Inhalte, welche nur für eine Unterseite erstellt wurden und auch nur auf dieser verwendet werden.

Übersetzt auf Deutsch heißt Duplictae Content so viel wie „doppelte Inhalte“ und wird oftmals auch DC genannt.
Duplicate Content ist ein sehr häufiges Problem, da diese Inhalte oftmals nicht beabsichtigt erstellt werden. Oftmals sind es einfach nur kopierte Texte oder komplett identische Einzelseiten, dazu aber später mehr. Grundsätzlich wird Duplicate Content unterteilt in internen und externen Duplicate Content. 

Das Thema ist sehr interessant, da es viele Erfahrungsberichte gibt, in welchen eine Webseite von Google abgestraft wurde, nachdem diese doppelte Inhalte verwendet hat. Hinzu kommt, dass es viele Mythen im Bereich Duplicate Content gibt, welche ich jedoch mit meinem umfangreichen Ratgeber-Artikel lösen möchte.

Was Duplicate Content nicht ist...

Viele Webseitenbetreiber denken, dass Inhalte, welche auf verschiedenen Webseiten oder Unterseiten verwendet werden, direkt Duplicate Content ist. Dies ist jedoch nur auf den ersten Blick richtig, da es auch, wie immer, Ausnahmen gibt. Diese wären zum Beispiel:

  • Mehrsprachige Webseiten:
    Webseiten, welche es in mehreren verschiedenen Sprach-Versionen gibt, sind kein duplicate Content.
  • Zitate, zitierte Textaussagen:
    Zitate und zitierte Textaussagen sind ebenfalls kein Duplicate Content, jedoch nur, wenn man auf eine korrekte, semantische Auszeichnung im Quelltext achtet. Ist diese nicht vorhanden, werden auch Zitate und zitierte Textaussagen als Duplicate Content gewertet. Hier erfährst du mehr über korrekte, semantische Auszeichnungen.

Arten von Duplicate Content

Wie zu Beginn des Artikels erklärt, wird Duplicate Content unterteilt in externen und internen Duplicate Content. Nun stellen Sie sich sicherlich die Frage: Was ist denn jetzt was und wo unterscheiden sich beide Arten? Genau aus diesem Grund werde ich im Folgenden beide Arten von doppeltem Inhalt erklären.

Interner duplicate Content:

Interner duplicate Content beschränkt sich grundsätzlich auf die eigene Domain (also zum Beispiel sharpenmarketing.de). Dieser doppelte Content ist in den häufigsten Fällen unbeabsichtigt entstanden und ist oft an folgenden Webseitenstellen zu finden:

  • interne Suchergebnisseite
  • Kategorieseite (sehr oft bei Online-Shops)
  • Produkteinzelseiten
  • Blogbeiträge, welche mehrere Kategorien besitzen
  • Paginationen

Externer duplicate Content:

Externer duplicate Content ist domainübergreifend, sodass dieser auf zwei oder mehr Domains auftritt. Hierbei ist das Problem für die Suchmaschine, dass diese nicht leicht entscheiden kann, welche Seite nun das Original ist, sodass auch geklauter Content vor dem Originalen in den Suchergebnissen stehen kann.
Dies wird jedoch bei Google immer schwerer, da eine Tendenz von Google da ist, dass die Webseite, welche zuerst mit diesen Inhalten indexiert wurde, die Originale ist. Geklaute Webseiten-Inhalte, zählen zum externem duplicate Content, da die die Inhalte schließlich webseitenübergreifend sind.

Beispiele für externen duplicate Content sind:

  • Produktbeschreibung (Nutzen mehrere Online-Shops das gleiche Produkt mit der gleichen Produktbeschreibung von dem Lieferantent?)
  • Versandinformationen von einem Logistikunternehmen
  • Content Diebstahl
  •  Verbreitung von Pressemitteilungen

Wiederkehrende Textbausteine:

Diese Art von duplicate Content findet man auf (fast) jeder Webseite, da sehr häufig die gleichen Absätze verwendet werden.
Dadurch, dass diese Art von duplicate Content so häufig anfällt, hat Google hierfür einen eigenen Nahmen: „Wiederkehrende Textbausteine“.

Hierfür gibt es viele Beispiele:

  • Urheberrechtshinweise
  • Cookie-Informationen
  • Versandinformationen
  • sehr kritisch: Footer
Damit Sie durch diese Art von duplicate Content keine Abstrafung bei Google bekommen, gibt es auch direkt Lösungen dazu. Du solltest immer, falls es rechtlich möglich ist, nur einen individuellen, kleinen Text als Urheberrechtshinweis, Cookie-Information oder Versandinformation verwenden, welcher auf eine ausführliche Unterseite verlinkt. Auf dieser findet der Besucher nun jegliche Informationen, womit Sie. die Thematik duplicate Content, umgehen.
Auch kritisch ist der Footer einer Webseite: Dieser sollte mit so wenig Informationen wie nur möglich beschmückt sein (Unternehmenstext, Über uns).  Ich empfehle maximal 300 Wörter, allerdings gibt es hierfür leider keine Quelle, sondern es sind eigene Erfahrungen.

Warum ist Duplicate Content ein Problem für Google?

Vorab: Duplicate Content ist einfach nicht gern gesehen. Schließlich soll der User das bestmögliche Ergebnis für seine Suchanfrage ausgespielt bekommen, was mit immer gleichen Inhalten einfach nicht möglich ist.

Hinzu kommen, bei duplicate Content für Google erhöhte Crawlingkosten, da der Bot mehrfach eine Seite crawlen und prüfen muss, ob es sich um doppelten Inhalt handel oder nicht. Dies kann schon nicht im Sinn von Google sein! Sie sollten versuchen, der Suchmaschine das Leben bestmöglich zu vereinfachen, obwohl viele Suchmaschinen, insbesondere Google, schon fast in der Lage ist doppelte Inhalte zu verstehen und richtig zu bewerten.

Ab wann handelt es sich um Duplicate Content?

Grundsätzlich handelt es sich um duplicate Content, sobald du doppelte Inhalte auf deiner Webseite hast, welche nicht als diese gekennzeichnet sind. Wie man duplicate Content als solches kennzeichnen kann, dazu weiter unten mehr.

Ein wirklich ausschlaggebendes Problem, bezogen auf duplicate Content,  hast du, wenn du mehr doppelte Inhalte auf deiner Webseite hast als Einzigartige, da in der Theorie, eine perfekt suchmaschinenoptimierte Webseite vollständig aus einzigartigem Inhalt besteht.
Du hast auch ein Problem, wenn sich Google nicht, aufgrund von doppelten Inhalten, entscheiden kann, welche indexierte Seite thematisch und inhaltlich relevanter ist, sodass mehrere Webseiten sich im Ranking, auf den Top-Positionen, ständig abwechseln. 

 

Wie wird Duplicate Content von Google bewertet?

Grundsätzlich gibt es hierauf keine klaren Antworten, wie gut oder schlecht, doch es gibt viele Vermutungen, welche unter anderem auf den Informationen von einem Video von Matt Cutts basieren. Dieser geht im Video auf die Frage ein, ob duplicate Content wirklich so “schlimm“ sei, oder nicht.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Duplicate Content lässt sich öfters nicht vermeiden, zum Beispiel bei wiederkehrenden Textbausteinen (insbesondere Rechtstexte), sodass das Ziel von einem Webhoster sein sollte, den duplicate Content auf ein Minimum zu reduzieren.
Ich denke, dass duplicate Content als eine Art Spam gewertet wird und somit direkt eine negative Tendenz besitzt, doch im Endeffekt geht es darum, dass der Suchende seine Frage, sein Problem oder sein Informationsbedürfnis stillen konnte.
Wenn du hierbei die Informationen lieferst, die der Suchende haben möchte, ist Google zufrieden und wird dies in deinen Rankings widerspiegeln. 

Nichtsdestotrotz würde ich es gar nicht darauf ankommenlassen. Ich würde einzigartige Inhalte erstellen, welche den Suchenden begeistern. Natürlich ist dies Arbeit, doch mit guten Inhalten ersparst du dir eine Menge arbeit, besonders wenn es zum Linkaufbau geht. Gute Inhalte bekomme mit der Zeit automatisch starke Backlinks, sodass du dir den Backlinkaufbau zum Großteil sparen kannst, wenn du geduldig bist.

Wie beeinflusst Duplicate Content das Ranking?

Wie schon so oft in diesem Beitrag gesagt, bevorzugt Google und alle anderen Suchmaschinen auch, einzigartige, relevante Inhalte.
Dadurch ist es von vornherein schon klar, dass doppelte Inhalte, neutralen oder negativen Einfluss auf deine Rankings haben. Je mehr Unterseiten deiner Webseite doppelte Inhalte vorweisen, umso schlechter ist es, da Google sich nicht sicher ist, welche Unterseite deiner Webseite am relevantesten und hilfreichsten für den Suchenden ist. Dadurch wird (höchstwahrscheinlich) die Relevanz zwischen beiden Unterseiten aufgeteilt, wodurch deine Webseite bei umkämpften Keywords sicherlich nicht auf den Top-Positionen vertreten sein wird. Dies sei gesagt zum internen duplicate Content.

Bei dem externen duplicate Content ist es nochmal eine andere Hausnummer. Denn wenn mehrere Webseiten identische Inhalte auf ihrer Webseite haben, ist Google sich nicht mehr sicher, welchen Ursprung die Inhalte haben. Dies ist jedoch aktuell ein Spiel mit dern Zeit: Google wird immer schlauer und kann mittlerweile schon (fast) fair und gerecht analysieren und verstehen, welche Webseite die Inhalte erstellt hat und welche Webseite diese einfach nur übernommen hat.

Grundsätzlich gilt aber: Je mehr duplicate Content auf deiner Webseite zu finden ist, umso aggressivere und größere, negative Auswirkungen, können diese auf deine Rankings haben. 

Was macht Google mit Duplicate Content?

Duplicate Content prüfen
Duplicate Content Infografik von Elliance.com

Was sind typische Beispiele für Duplicate Content?

Ich habe zwar eben schon ein paar Beispiele für internen und externen duplicate Content genannt, jedoch werde ich im folgenden einmal weitere Beispiele aufzählen, da duplicate Content eigentlich mit Leichtigkeit verhindert werden kann!

  1. Webseiten, die unter https:// und http:// erreichbar sind
  2. Webseiten, welche erreichbar unter https://www.beispiel.de und https//beispiel.de sind
  3. Erreichbare URLs, mit Groß- und Kleinschreibung beispiel.de/Beispiel oder beispiel.de/beispiel
  4. Alte Seiten werden durch neue ersetzt
  5. Mehrsprachige Webseiten, Zitate oder zitierte Aussagen, wenn diese nicht dementsprechend gekennzeichnet sind
  6. Print Versionen von Seiteninhalten (besonders bei alten Webseiten)
  7. (automatisch) generierte Shop-Seiten wie Kategorien, Tags, Archive
  8. Paginierung von Kommentaren

Duplicate Content prüfen

Duplicate Content prüfen mit Google:

Der einfachste Weg doppelte Inhalte zu prüfen, ist der mithilfe der Google Suchoperatoren. Hierfür brauchst du nur deinen überprüfenden Text bei Google in Anführungszeichen in das Suchfeld eingeben und direkt kriegst du eine Lösung. Dies kann jedoch sehr aufwändig sein, besonders wenn große Mengen an Texten geprüft werden sollen. Diesbezüglich gibt es richtige Duplicate Content Checker. “Überprüfender Textauszug”

Duplicate Content prüfen mit der Google Search Console:

Die neue Google Search Console hilft dir, wie die Alte auch, bei der internen überprüfung auf duplicate Content. Hierfür gehst du einfach in dein Backend deiner Google Search Console, klickst im Report auf “Indexabdeckung” und schon solltest du unter dem Reiter “Duplikat” jegliche doppelten Inhalte sehen. Wie gesagt, ist diese Möglichkeit nur bei internem duplicate Content einsetzbar.

Wie funktionieren Duplicate Content Checker?

Wie eben schon angesprochen, gibt es professionelle Duplicate Content Checker, welche im Internet nach doppelten Inhalten, für dich, suchen. Diese arbeiten im Normalfall nicht anders als die Suchmaschine selber, da die zu überprüfenden Textausschnitte auch mit den Inhalten aus dem World Wide Web verglichen werden.

Hierfür greifen die duplicate Content Checker auch auf den Google Index zu, erleichtern dir doch die Arbeit, zum Teil, sehr.

Denn die Content Checker arbeiten oftmals automatisch (von Duplicate Content Checker zu Duplicate Content Checker unterschiedlich), schicken dir automatisch eine Benachrichtigung mit der Seite, auf welcher der doppelte Inhalt gefunden wurde, führen automatische, wiederholende Duplicate Content Analysen durch oder lassen sich, zum Beispiel durch die Angabe, ab wann ein Content Checker ausschlagen soll, filtern.

Duplicate Content Checker: Siteliner

Siteliner, früher Copyscape ist wahrscheinlich der am häufigsten verwendeter Duplicate Content Checker, da er erst einmal recht bekannt ist, aber auch benutzerfreundlich, trotz des eher lustlosen Design, ist. Die Bedingung und das Handling ist einfach, die Algorithmen, die doppelte Inhalte finden sollen, arbeiten zuverlässig und Siteliner ist kostenfrei bis zu 250 Analysen von Webseiten. Danach gibt es eine Premiumversion.

Duplicate Content Checker
Siteliner.com | 26.12.2019

Duplicate Content Checker: Plagium

Plagium ist ein kostenpflichtiger duplicate Content Checker, welcher aber kostenfrei ist, wenn die Texte nicht länger als 5000 Zeichen sind. Dennoch hat Plagium auch einen starken Vorteil: Es gibt Einstellungsmöglichkeiten, wo der duplicate Content Checker suchen soll, zum Beispiel im World Wide Web oder auf den sozialen Netzwerken?

Außerdem bietet Plagium eine Suchmethode an, welche deutlich gründlicher ist, wodurch Plagium natürlich auch kostenpflichtig ist.

Duplicate Content Checker
Plagium.com | 26.12.2019

Duplicate Content Checker: Copygator

Copygator ist ebenfalls ein doppelter Inhalt Checker, welcher sich aber hauptsächlich auf Blogger spezialisiert hat, da die Zielgruppe Blogger mit einem Blog sind. Schließlich checkt Copygator nur RSS Feed´s auf duplicate Content und nicht im Index.
Falls Copygator dennoch für dich interessant ist, ist auch ein entscheidender Vorteil, dass du bei doppeltem Inhalt, automatisch benachrichtigt wirst.

Duplicate Content Checker
Copygator.com | 26.12.2019

Die Grenzen eines Duplicate Content Checkers:

Ja, es ist ein Tool, sodass man sich oftmals die Frage bei der Nutzung stellt: Duplikate sollten gefunden werden, doch zu welchem Preis? Schließlich kostet das Suchen nach diesen entweder Zeit, Geld oder Nerven – öfters auch alles zusammen.
Außerdem wird ein Vorteil von duplicate Content Checkern auch gleichzeitig zu einem Nachteil: die Filterungsmöglichkeiten und Anschlagdaten, denn entweder schlägt der Content Checker zu oft an oder zu selten, wodurch doppelte Inhalte unentdeckt bleiben.

Ein weiterer Nachteil von duplicate Content Checkern ist, dass diese oftmals auf einen Suchmaschinen-Index zugreifen – in den meisten Fällen der Google-Index. Dieser besteht zwar aus etlichen Daten und Webseiten, dennoch fehlen (immer) Webseiten, welche dann nicht in den Plagiatscheck miteinbezogen werden.

Dennoch ist ein solcher Checker sicherlich hilfreich, doch auch dieser bietet dir keinen 100% Schutz vor doppelten Inhalten. Ich persönlich muss sagen, dass ich nur im Notfall einen solchen duplicate Content Checker nutze; eher greife ich zu den Check Möglichkeiten von Google.

Wie lässt sich Duplicate Content vermeiden?

Grundsätzlich ist es verdammt einfach: Erstelle für jede Webseite einzigartige, hochwertige und relevante Inhalte. Außerdem solltest du deine Webseiten Link- und Crawlingstruktur im Überblick behalten, da du dadurch schnell sehen kannst, ob es für einen Themenbereich schon eine ausführliche Unterseite gibt, auf welcher die Intention des Suchenden vollkommen berücksichtigt wurde oder nicht. Falls ja solltest du die Seite, im besten Fall, mithilfe einer 301-Weiterleitung (WEBLINK), auf die gewünschte Zielseite, weiterleiten. Falls nicht, solltest du eine neue Unterseite erstellen.

Falls du schon ein Problem mit duplicate Content hast und zwei Unterseiten sich für einen Suchbegriff öfters, auf den Top Positionen, bei Google abwechseln, solltest du die Unterseiten individualisieren und spezialisieren – füge Inhalte hinzu oder entferne Inhalte, sodass Google versteht, worum es auf deiner Unterseite geht und welche Unterseite besonders relevant für einen Suchbegriff ist.
Mithilfe eines guten Planes zu Beginn deines SEO-Projektes oder deiner Unternehmens-Webseite, kommen doppelte Inhalte gar nicht vor ;).

Webseite mit doppeltem Inhalt richtig kennzeichen:

Wie zu Beginn versprochen, nenne ich dir nun noch zwei Möglichkeitem, wie du internen duplicate Content richtig kennzeichnen kannst.
Möglichkeit Nummer 1 wäre eine Canonical URL. Der Bot erkennt beim Crawlen, dass die Zielseite des Canonical-Links, das Original ist, wodurch die Unterseiten mit doppeltem Inhalt, mit Hinblick auf duplicate Content, ignoriert werden.
Ein Link, welcher mit einem Canonical-Tag versehen ist, sieht so aus:
<link rel=“canonical“ href=“https://beispiel.de/test1″ />

Eine andere Möglichkeit wäre ein dauerhafter 301-Redirect per .htaccess:

Duplicate Content vermeiden
seo-summary.de | 26.12.2019

0