Duplicate Content habe ich ja in meinem letzten Artikel über die Optimierung von Online Presseportalen bereits angeschnitten. Da dieses Thema immer wieder heiß diskutiert wird und sich wie ein Schreckgespenst in vielen SEO Köpfen festgesetzt hat, finden Sie nachfolgend das Wichtigste, wie Google duplizierte Inhalte sieht und wie Sie Duplicate Content vermeiden können.
Was ist für Google Duplicate Content?
Generell gibt es zwei Möglichkeiten auf der eignen Seite Duplicate Content zu erzeugen:
1. Sie veröffentlichen Inhalt doppelt an unterschiedlichen Stellen Ihrer Seite. Das kann zum Beispiel der Fall sein, wenn ein Thema in zwei Bereiche passt und in jedem dieser Topics eine eigene Seite mit identischem Inhalt erstellt wurde. Hier gilt es, nur eine Seite zur Verfügung zu stellen und darauf von beiden Themen hin zu verlinken.
2. Ihr Content wird von anderen Seiten kopiert. Hier kann ich Sie aber beruhigen. Wie bereits bei den Online Presseportalen erwähnt, erkennt Google in der Regel sehr gut, welcher Text das Original ist. Am einfachsten natürlich durch das Veröffentlichungsdatum. Somit haben Sie kein Duplicate Content Problem, sondern der Dritte, der Ihre Seite kopiert. Tut er/sie dies mit Ihrer Erlaubnis, gilt die Regel: Link zu Ihrer Originaldatei setzen.
Was ist für Google kein Duplicate Content?
Übersetzungen werden von Google nicht als Duplicate Content gesehen. Wenn Sie Ihre Texte und Dateien in mehreren Sprachen auf der Webseite anbieten, geht dies selbstverständlich in Ordnung.
Auch Zitate, sogenannte Snippets, werden von Google nicht als Duplicate Content angesehen.
Was passiert mit Duplicate Content Seiten?
Laut Google hat Duplicate Content allerdings in der Mehrzahl der Fälle keinen negativen Einfluss auf das Ranking Ihrer Seiten. Die doppelten Inhalte werden in der Regel nur gefiltert und erscheinen nicht in den Suchergebnissen. Das schlimmste was Ihnen hier also passieren kann ist, dass die falsche Version von Google gelistet wird.
Lediglich wenn Google eine böswillige Absicht erkennt, liegt ein Verstoß gegen die Webmasterrichtlinien vor und nur in solchen Fällen straft Google diese Seiten ab.
Wie vermeiden Sie Duplicate Content?
Wenn Sie Ihren Besuchern sowohl eine Druckansicht, als auch eine „normale“ HTML Seite zur Verfügung stellen, können Sie Google sagen, welcher Inhalt in das Suchmaschinenranking aufgenommen werden soll. Dies machen Sie entweder, indem Sie ein Disallow in das entsprechende Verzeichnis setzen oder über einen Eintrag in der robots.txt-Datei.
Die Alternative hierzu, mit der Sie Duplicate Content in den Griff bekommen, nennt sich Canonical-Tag. Mit diesem Tag (link rel=“canonical“ href=“ihre URL“/) können Sie den Suchmaschinen die „richtige“ URL vorgeben. Hiermit kann Duplicate Content zwar nicht wirklich verhindert werden, denn so müssen ja beide Seiten von Google indiziert werden, aber falls er denn auftaucht, kennt Google zumindest die von Ihnen favorisierte Seite.
Sie können auch für Seiten, die von Google nicht erfasst werden sollen ein 301 Redirect nutzen. So werden User und Suchmaschinenspiders zur richtigen Seite weitergeleitet.
Nutzen Sie Top Level Domains für mehrsprachige Inhalte. Posten Sie auf .de Ihre deutschen Texte, auf .com Ihre englischen, usw.
Stellen Sie eine konsistente Verlinkung Ihrer Websites sicher. Ihre Unterseiten sollten beispielsweise nicht unter www.homepage.de/seite und www.homepage.de/seite/ sowie unter www.homepage.de/seite/indext.html erscheinen.
Die Erreichbarkeit Ihrer Seite mit und ohne www kann ebenfalls Douplicate Content erzeugen. Am einfachsten begegnen Sie diesem Fall, durch ein Google Konto für dessen Webmastertool. Hier können Sie Google sagen, welche Schreibweise Sie favorisieren und somit auch das Problem Douplicate Content entschärfen.
Wie Anfangs bereits erwähnt noch eine Anmerkung zum Thema geteilte Inhalte: Wenn Ihr Artikel auf anderen Webseiten erscheint, achten Sie darauf, dass jeweils ein Link zu Ihrem Original mit angegeben wird.
Near Duplicate Content
Wie sieht es aber im umgekehrten Fall aus? Ein Artikel erscheint zuerst z.B. in einer Onlinezeitung und Sie wollen Ihn anschließend auf Ihrer Webseite veröffentlichen? Jetzt haben Sie zwei Möglichkeiten: Entweder Sie setzten einen Link zum Original, dann verlieren Sie aber die Linkpower oder Sie variieren den Text für Ihre Seite. Hier stellt sich dann aber die Frage: Wie viel Text muss abgeändert werden, damit Google nicht mehr von Duplicate Content spricht? Die Antwort ist schwierig und ich habe selbst nur Vermutungen im Internet gefunden. Von mindestens 20% Abweichung ist hier die Rede. Bestätigen kann ich dies allerdings nicht und ein offizielles Statement von Google war auch nicht zu finden.
Wie findet Goolge Near Duplicate Content? Google untersucht die Texte mit Hilfe der sogenannten Shingle Technik – auf Deutsch: Schindel Technik. Ein Satz wird in Abschnitte, sogenannte Schindel, unterteilt, um so die einzelnen Elemente zu identifizieren und danach rechnerische zu vergleichen. Hier in die Einzelheiten zu gehen, übertrifft allerdings meine technischen Fähigkeiten.
Um festzustellen, wie viele Überschneidungen Texte haben, können Sie die Software UN.CO.VER nutzen, die Ihnen den Grad als Prozentzahl anzeigt. So können Sie selbst einschätzen, wie einzigartig Ihr Content ist.
Detaillierte Informationen in der Google Webmaster Zentrale
Ausführliche Informationen finden Sie zum Thema Duplicate Content auch in der Google Webmasterzentrale:
– Duplicate Content aufgrund von Scraper-Sites
– Duplicate Content – Best Practice bei dupliziertem Inhalt
– Duplicate Content-Session auf der SMX Advanced
– Content duplizieren
Kai-Uwe Gutsch
(Follow Me – Der Social Media und Online Marketing Blog)
Hallo,
in der Regel nutzen auch wir eine Software, um genau zu prüfen, ob der Content duplicate ist, oder nicht. Gerade dann, wenn man große mengen an Content schreibt kommt es immer wieder vor, dass sich einzelne Passagen ähneln, oder etwas zu ähnlich klingt. Dank der richtigen Software lässt sich so etwas jedoch gut bewerkstelligen.
gruß aj