WDF*IDF Analyse – Best Practice

Dieser Beitrag ist ursprünglich auf dem Blog von onpagedoc.com erschienen und wurde nach der Übernahme von OnpageDoc durch Seobility auf dem Seobility Blog neu veröffentlicht. In den Praxisbeispielen wird das WDF*IDF Tool von OnpageDoc genutzt, welches Du selbstverständlich auch weiterhin für Deine WDF*IDF Analysen verwenden kannst. Darüber hinaus solltest Du dir aber auch mal das WDF*IDF Tool von Seobility ansehen, mit welchem Du noch mehr Analysen pro Tag durchführen kannst.

Was ist dieses WDF*IDF eigentlich?

Immer dann, wenn man über Content in Bezug auf SEO spricht, dann redet man zwangsläufig auch über WDF*IDF oder Termgewichtung. Beinahe jedes Analyse-Tool, dass sich auf Suchmaschinenoptimierung spezialisiert hat, bringt eine solches Analyse-Feature mit, um den geschriebenen Text zu optimieren. Aber bevor man sich Hals über Kopf und mit allen Texten in diese „Wunderformel“ stürzt, sollte man verstehen, was WDF*IDF eigentlich ist, wie es funktioniert und wann man besser die Finger davon lässt.

Definition & Erklärung

Ok, Reset: wir vergessen einmal kurz jedes Halbwissen und Gerüchte und wollen noch einmal kurz klären, für was die Formel WDF*IDF eigentlich steht. Within Document Frequency * Inverse Document Frequency – alles klar? Nicht wirklich, oder? Die reine Definition bringt uns hier nicht bedeutend weiter. Eine Erklärung aber schon: es werden zu einem beliebigen Suchbegriff (dieser kann auch aus mehreren Wörtern bestehen) die Top-Websites in den Google Suchergebnissen analysiert und deren Wörter nach Häufigkeit gewichtet. Füllwörter wie „haben“, „ist“, „und“ kommen verhältnismäßig oft vor (auf den analysierten Websites und auf allen anderen Internetseiten generell) und haben daher eine schwächere Gewichtung. Desto spezieller das Wort aber wird, desto seltener kommt es grundsätzlich im Netz vor und umso höher ist die Gewichtung dafür.

Termgewichtung Best Practice

Wem das bis jetzt noch zu theoretisch war, dem sei hier ein praktisches Beispiel gegeben. Wollen wir beispielsweise einen Text zum Thema „Eierschalensollbruchstellenverursacher“ (ja, das Ding gibt es wirklich) bestmöglich auf Relevanz mittels einer WDF*IDF-Analyse schärfen, dann sieht das Ergebnis zur Termgewichtung erst einmal so aus:

WDF*IDF Analyse Termgewichtung

Das SEO-Tool OnpageDoc zeigt hier nun also an, welche Worte die höchste Gewichtung für unser Keyword haben. Was oft falsch verstanden wird: gemeint ist hier nicht die absolute Anzahl der verwendeten Häufigkeit pro Keyword, sondern nur ein Indikator über die Höhe der Gewichtung. Das Wort “Eierschalensollbruchstellenverursacher“ ist eben so selten, dass es die höchste Gewichtung hat. Es bedeutet aber nicht, dass es auch sehr häufig im Text vorkommen muss. Das Analyse-Tool zeigt uns hier eben Worte an, die auf anderen Websites auch vorkommen, die zu unserem Keyword ranken, sprich die in diesem Kontext auch relevant sind.

Warum funktioniert WDF*IDF nicht immer?

Nun könnte man ja denken: „Super. Ich führe jetzt einfach für alle meine Texte eine WDF*IDF-Analyse durch und optimiere die Wörter danach und dann ranke ich automatisch besser.“ Klingt logisch und verlockend, ist aber leider falsch. Denn die Termgewichtung ist vieles, ein Allheilmittel oder gar eine Ranking-Garantie mit Sicherheit nicht. In einigen Fälle ist es sogar gänzlich sinnlos, Websites damit zu analysieren und optimieren. Auch hier soll uns wieder ein Beispiel für ein besseres Verständnis dienen.

Shorthead Keywords

Speziell bei sehr kurzen Suchbegriffen, bei denen die Suchintention dahinter nicht wirklich eindeutig ist, wäre eine WDF*IDF-Analyse absolut sinnlos. Nehmen wir beispielsweise den Shorthead Suchbegriff „Info“ und schauen uns an, was die Analyse von OnpageDoc dazu auspuckt:

WDF*IDF Analyse

Nun mag man vielleicht der allerkreativste Schreiberling unter der Sonne sein, aber einen sinnvollen Text mit dieser Kombination von Suchbegriffen wird wohl kaum umsetzbar sein. Und selbst wenn doch: dann würde man höchstwahrscheinlich trotzdem nicht zu „Info“ ranken. Warum? Ganz einfach: das Wort „Info“ ist eigentlich nur eine Worthülse und kann breitgefächerter kaum sein. Schaut man sich dazu die Termgewichtung an, dann wird das ziemlich deutlich. Von Regionen, Fernsehsendern und absolut generischen Begriffen ist im Prinzip alles vorhanden. Selbst wenn man nun alle diese Begriffe der Gewichtung nach in einen Text packen würde (den Sinn dieses Wortkonstrukts stelle ich erst einmal nicht zur Diskussion), dann würde man dazu trotzdem nicht ranken. Erst in der Kombination mit mindestens einem weiteren Wort (wir befinden uns dann im Midtail-Bereich) wird es auch für die Suchmaschine greifbar und sinnvoll: „Wetter Info“, „Schwarzwald Info“ oder „NDR Info“ lassen sich inhaltlich viel besser definieren und schon wird ein Schuh draus und auch WDF*IDF ergibt wieder Sinn.

Do-Intent Suchbegriffe

Ähnlich schwierig verhält es sich mit „Do-Intent“ Keywords – also Suchphrasen, die auf eine Aktion abzielen. „Sportschuhe bestellen“ wäre eine solche Suchanfrage in dieser Kategorie. Google ist mittlerweile so schlau, dass hier gezielt lokale und Onlineshops als erstes angezeigt werden, ohne das auf der Zielseite auch nur einmal so etwas wie „kaufen“ oder „bestellen“ vorkommen muss. Warum auch? Wenn ein Nutzer in einem Onlineshop ist und einen großen Button mit der Beschriftung „in den Warenkorb“ sieht, muss nicht mehr erklärt werden, was hier zu tun ist. Und genau das versteht mittlerweile auch Google dank semantischer Logik sehr gut und rankt eben diese Seiten ohne WDF*IDF-Optimierung trotzdem sehr gut.

Wann ist die Wortanalyse sinnvoll?

Nun könnte man den Eindruck bekommen, dass WDF*IDF ziemlich sinnfrei ist, oder? Stimmt aber nicht. Eigentlich ist diese Form der Analyse ziemlich cool und kann das Ranking bei Google wirklich verbessern. Man muss eben nur klar abgrenzen, wann man es einsetzen sollte.

Longtail-Search

Immer wieder hört man aus dem SEO-Lager: „Suche ist Longtail!“ Und irgendwie stimmt das in den meisten Fällen auch. Einfaches Beispiel? Kaum jemand würde nur nach „Sportschuhen“ suchen, oder? Man hat doch hier meist etwas bestimmtes im Sinn, z.B. „Sportschuhe für Männer“ oder „Sportschuhe schwarz indoor“ oder „Sportschuhe Unisex Größe 43“. Und schon sind wir im Longtail-Bereich und plötzlich macht auch WDF*IDF wieder Sinn, denn man könnte ja auch eine Informationsseite darüber aufgebaut haben, was das Besondere an „Sportschuhen für Männer“ ist.

Know-Intent Suchbegriffe

Ändern wir einmal die Suchintention von „Do“ auf „Know“, also von „Machen“ auf „Wissen“. Hier ist die WDF*IDF-Analyse eine prima Sache, denn immer dann wenn es um (generische) Informationen geht, dann geht es auch um inhaltliche Relevanz und GENAU DAS ist die Stärke der Termgewichtung. Wenn man über ein bestimmtes Thema schreibt, dann geht es auch darum, den Content auf dieses Thema zu schärfen. In vielen Dingen ist hier das Online-Lexikon Wikipedia Spitzenreiter, denn Google „weiß“, dass die hier abgebildeten Informationen redigiert und (meist) fachlich fundiert sind – ergo einen sehr hohen Relevanzfaktor haben. Klar kassiert Wikipedia eben auch deswegen viele Backlinks auf seinen Content, was die Suchergebnisplatzierung nochmals beflügelt. Und auch die Nutzersignale (Klickrate, Verweildauer usw.) dürften bei der Online-Enzyklopädie ziemlich stark sein. Aber all das wäre nicht möglich, wenn der Content nicht einen sehr hohen Qualitäts-Index besäße.

Freshness als Relevanzfaktor

Wenn wir schon beim Thema Wikipedia und Relevanz sind, schauen wir doch mal, wie die Enzyklopädie hier die Definition ansetzt:

„Relevanz ist eine Bezeichnung für die Bedeutsamkeit oder Wichtigkeit, die jemand etwas in einem bestimmten Zusammenhang beimisst.“

Ich würde gerade bei digitalen Content noch einen weiteren Punkt hinzufügen: Aktualität. Denn bei vielen Themen spielt der Freshness-Faktor keine unbedeutende Rolle. In diesem Zusammenhang kann eine gezielte WDF*IDF-Analyse sogar eine perfekte Unterstützung sein.

WDF*IDF Analyse

Möchte man beispielsweise einen Artikel über die Ukraine Krise schreiben und macht dazu eine Termgewichtungsanalyse, dann sieht man, dass dort an Stelle 1 der Begriff „Rötzer“ steht. Warum? Ganz einfach: gemeint ist der Journalist Florian Rötzer, der regelmäßig Berichte zum Thema schreibt und zum Zeitpunkt der Analyse gerade erst wieder ein Text veröffentlicht hat, der auf verschiedenen News-Portalen zitiert wird. Wohingegen die exakte Suchphrase „Ukraine Krise“ nicht ein einziges Mal vorkommt, denn das semantisch Gesamtgeflecht aus wichtigen Begriffen beschreibt dieses Thema einfach viel besser, als mantra-artig immer wieder das Ziel-Keyword zu wiederholen. Und jetzt kommt der Freshness-Faktor dazu, denn bei einem solchen Ereignis gibt es manchmal stündlich neue Ereignisse und dementsprechend auch ständig neue Wörter die in Bezug auf die Ukraine Krise wichtig und relevant sind. Ein rein statischer Text mit generischen Informationen dazu wäre also weniger relevant, als eine Seite, die regelmäßig neue und aktuelle Infos zu dem Thema veröffentlicht. Will man also in einer solchen Situation für die Suchmaschine so relevant wie möglich sein, sollte man eine WDF*IDF-Analyse nicht nur ein einziges Mal, sondern eben mehrmals für die Suchphrase durchführen, denn hier ändert sich die Gewichtung der einzelnen Keywords regelmäßig.

Kurz zusammengefasst

Hier noch einmal die wichtigsten Punkte über die Termgewichtung zusammengefasst.

WDF*IDF ist dann sinnvoll, wenn…

  • … man über aktuelle Geschehnisse schreibt (Freshness matters).
  • … man von einer „Know-Intent“ Suchphrase ausgeht.
  • … man Inspiration bei der Fach-Recherche braucht.

WDF*IDF ist (meist) nicht sinnvoll, wenn…

  • … man von einer „Do-Intent“ Suchphrase ausgeht.
  • … man eine simple Anleitung für guten Content sucht.

Merke: WDF*IDF ist definitiv ein gutes Werkzeug, dass man richtig einsetzen muss, damit es helfen kann. Ein Allheilmittel oder eine Zauberformel für guten Content ist die Termgewichtung definitiv nicht – es bedarf eben doch der guten alten Kreativität beim Schreiben von Texten.

Beitragsbild: © freepik.com

PS: Erhalte neue Blog Artikel direkt in Dein Postfach!

Ein Gedanke zu „WDF*IDF Analyse – Best Practice

Lukas Winterschmid
14. Januar 2020 21:57

WDF*IDF ist mein bester Freund und gleichzeitig meine absolute „SEO-Nemesis“! Umso mehr danke für diesen informativen Beitrag 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.