Texteinzigartigkeit und ähnliche Dokumente

Ein wichtiger Bestandteil jeder SEO-Strategie ist die Vermeidung von Duplicate Content

Ein zu hoher Anteil an Duplicate Content oder eine sehr niedrige Einzigartigkeit der Texte kann schnell ernsthafte Konsequenzen im Ranking nach sich ziehen. Oft werden Seiten, die nur wenig einzigartigen Content besitzen, vom Panda Update abgestraft.

Seolingo führt verschiedene Analysen durch, um verschiedene Arten von Duplicate Content aufzudecken. Doch Seolingo kann sogar noch mehr: nicht nur echter Duplicate Content kann zur Abwertung durch einen Ranking-Algorithmus führen. Explizit genannt wird von Google das Vorhandensein von vielen thematisch sehr ähnlichen und überlappenden Artikeln als Faktor für den Qualitäts-Algorithmus „Panda“. Seolingo erstellt daher für jede analysierte Unterseite einen sogenannten thematischen „Footprint“ und kann dadurch auch Seiten aufspüren, die zwar keinen Duplicate Content besitzen, sondern lediglich eine zu hohe thematische Überschneidung aufweisen.



Onpage-Einzigartigkeit

Dieser Report zeigt die Einzigartigkeit der Texte innerhalb eines Dokumentes.
Es wird geprüft, ob ein Text sich oft wiederholende Formulierungen verwendet. Ein Text, der keinerlei sich wiederholende Fragmente besitzt, erhält hier den optimalen Wert von 100.

Ein niedriger Wert deutet nicht auf ein klassisches Duplicate-Content-Problem hin (da die Duplizierung nicht in anderen Dokumenten stattfindet, sondern innerhalb des Dokumentes selbst), sondern kann eher ein Hinweis auf eine stilistische Schwäche des Textes sein.

In der Detailansicht können Sie sich durch Klick auf einen Wert die am häufigsten wiederholten Formulierungen anzeigen lassen.

Die Onpage-Einzigartigkeit einer Unterseite können Sie auch mit dem Seolingo-Schnellcheck direkt online prüfen.

Domain-Einzigartigkeit

Die Domain-Einzigartigkeit gibt an, wie groß der Duplicate-Content-Anteil eines Dokumentes innerhalb der gesamten Domain ist.

Ein Wert von 100 bedeutet, dass es keinerlei Duplikate Content innerhalb der gesamten Domain für das entsprechende Dokument gibt. Ein Wert von 0 bedeutet, dass jeglicher Textabschnitt des Dokumentes sich auch
mindestens auf einer weiteren Unterseite befindet.

Wenn Sie beim Crawl die Boilerplate-Entfernung aktiviert haben, wird der Boilerplate-Content hier bereits herausgerechnet, d.h. der Einzigartigkeits-Faktor bezieht sich nur auf den Inhalt, der kein Boilerplate ist.

Wenn Sie viele Seiten mit niedrigem Einzigartigkeitsfaktor im Index haben, kann dies als negatives Qualitätsmerkmal gewertet werden. Überlegen Sie sich, ob Sie die Seiten individueller gestalten können oder schließen sie Seiten z.B. durch Verwendung des noindex-Tags aus dem Suchmaschinen-Index aus.

Duplikate

Gemäß der Duplicate Content Berechnung werden in diesem Report für jede Seite die Unterseiten bestimmt, die eine hohe Übereinstimmung mit dem Ursprungsdokument haben. Es werden die Seiten angegeben, die mindestens 50% des Contents des Ursprungsdokuments besitzen.

Seiten, für die viele ähnliche Seiten existieren, sollten überprüft werden. Gegebenenfalls können die Seiten überarbeitet und individueller gestaltet werden oder Sie können Seiten z.B. durch Verwendung des noindex-Tags aus dem Suchmaschinen-Index ausschließen.

Wenn Sie beim Crawl die Boilerplate-Entfernung aktiviert haben, wird der Boilerplate-Content hier bereits herausgerechnet, d.h. bei der Berechnung der ähnlichen Seiten wird nur der Content berücksichtigt, der kein Boilerplate ist. Umgekehrt kann es bei deaktivierter Boilerplate-Entfernung der Fall sein, dass sehr viele ähnliche Seiten angezeigt werden, wenn eine Seite einen hohen Anteil an Boilerplate-Content besitzt.

Thematische Überlappung

Für jedes Dokument wird ein thematischer „Footprint“ berechnet und die Footprints aller Seiten werden miteinander verglichen. So können Seiten bestimmt werden, die eine sehr ähnliche thematische Ausrichtung besitzen. Es werden hier die Dokumente angezeigt, deren thematische Überschneidung mindestens 70 % beträgt.

Das Vorhandensein von vielen Seiten mit großer thematischer Überschneidung wird von Google explizit als möglicher negativer Qualitätsfaktor für das Panda-Update genannt. Überlegen Sie also, ob Sie thematisch sehr ähnliche Seiten unter Umständen nicht zusammenfassen können.

In der Detailansicht sehen Sie auch, ob thematisch ähnliche Seiten miteinander verlinkt sind. Wenn Sie die Seiten weiterhin behalten möchten macht es oft Sinn, diese thematisch ähnlichen Seiten untereinander zu verlinken, um die interne Verlinkung zu optimieren.