Termfrequenz

Aus Seobility Wiki
Wechseln zu: Navigation, Suche

Was ist Termfrequenz?

Termfrequenz
Abbildung: Termfrequenz - Autor: Seobility - Lizenz: CC BY-SA 4.0

Termfrequenz bezieht sich darauf, wie häufig ein Term oder ein Wort in einem Text oder Dokument vorkommt. Bei der Informationsgewinnung ist sie eine der wichtigsten Methoden, um relevante Informationen aus einer größeren Sammlung von Dokumenten herauszufiltern. Wenn man beispielsweise nach einem Dokument sucht, das für „Suchmaschinenoptimierung“ relevant ist, könnte man angemessenerweise davon ausgehen, dass die Seiten, die dieses Wort enthalten, oder diejenigen, die es am häufigsten enthalten, für die Suche relevanter als solche Dokumente sind, die das Wort nicht enthalten.

Seit ihrer ersten Verwendung wurden viele verschiedene Varianten der Termfrequenz entwickelt. Zunächst wurde Termfrequenz für die Häufigkeit eines Worts in einem Dokument verwendet, ohne den Dokumentenumfang dabei zu berücksichtigen. Später wurden neue Varianten hinzugenommen – von Varianten, die an die Dokumentlänge angepasst sind (im Vergleich zur Gesamtzahl der Wörter), bis hin zu Methoden, die die Verwendung des Worts mit den häufigsten Wörtern im Dokument vergleichen.

Wie funktioniert Termfrequenz?

Obwohl es zahlreiche Varianten gibt, wie die Termfrequenz heute verwendet wird, dreht es sich dabei stets um die Anzahl, wie oft ein Wort in einem Dokument vorkommt. Die Termfrequenz kann eine wirksame Möglichkeit sein, um Dokumente oder Seiten herauszufiltern, die nicht relevant sind, weil sie den bzw. die gesuchten Term(e) nicht enthalten. Sie kann auch eine gute Methode sein, um Seiten zunächst nach Relevanz zu ordnen, indem die Häufigkeit eines Wortes in den Dokumenten verglichen wird. Häufig werden auch komplexere Varianten der Termfrequenz mit anderen Faktoren in Algorithmen zum Sortieren von Dokumenten oder Seiten kombiniert.

Wofür kann die Termfrequenz verwendet werden?

Eine Möglichkeit, die Termfrequenz zu verwenden, ist die Unterstützung von Computerprogrammen bei der Beurteilung der Relevanz von Dokumenten. Diese Sortierprogramme, auch Sortieralgorithmen genannt, haben die Aufgabe, alle irrelevanten Dokumente oder Seiten aus einer Datenbank auszusortieren und die verbleibenden nach Relevanz zu ordnen.

Früher wurden einfache Sortieralgorithmen, die auf der Termfrequenz basierten, von Google und anderen Suchmaschinen zur Sortierung von Suchergebnissen verwendet. Dies führte oft dazu, dass Seitenbetreiber zusätzliche Keywords auf ihrer Seite versteckten, damit die Seite dadurch relevanter erschien. Heute sind die Sortieralgorithmen komplexer und beinhalten Hunderte verschiedener Faktoren und komplexere Methoden zur Bestimmung der Relevanz.

Die Termfrequenz ist außerdem ein wichtiger Bestandteil von WDF*IDF, einer Methode, mit der die Relevanz bestimmter Wörter in einem Dokument ermittelt wird.

Termfrequenz und WDF-IDF

WDF-IDF ist eine Methode zur Bestimmung der Relevanz eines Worts in einem Dokument. WDF-IDF kombiniert die Termfrequenz mit der inversen Dokumentfrequenz, um die Relevanz eines Worts in einem Dokument im Vergleich zu allen anderen Dokumenten der Sammlung zu messen. Jedem Wort wird basierend auf der inversen Dokumenthäufigkeit ein Wert zugewiesen, der bezeichnet, wie oft ein Wort in den anderen Dokumenten vorkommt. Dieser weist darauf hin, wie einzigartig ein Term ist, was dazu beitragen kann, den Informationsgehalt des Terms zu bestimmen.

Wörter wie „der/die/das“ und „ein“ kommen in allen Dokumenten sehr oft vor, während aussagekräftigere Begriffe wie z. B. „SEO“ oder „Suchmaschine“ nicht so häufig vorkommen und daher einen höheren Wert erhalten. Der Wert steigt dann in Abhängigkeit der Termfrequenz. WDF-IDF hat sich als sehr effektiv beim Filtern von Stoppwörtern sowie von Wörtern, die in bestimmten Branchen sehr häufig verwendet werden, erwiesen.

Termfrequenz

Screenshot vom WDF*IDF-Tool von Seobility für die Content-Optimierung

Relevanz für SEO

Die Termfrequenz ist als Bestandteil von WDF*IDF nach wie vor ein wichtiger Teil von SEO. Obwohl Google und andere Suchmaschinen schon lange nicht mehr nur die Termfrequenz zur Beurteilung der Relevanz heranziehen, kann die Content Optimierung mit WDF*IDF immer noch zu besseren Suchmaschinen Rankings beitragen. Die Termfrequenz kann darüber hinaus auch verwendet werden, um wichtige Begriffe auf konkurrierenden Seiten zu identifizieren. Sie hilft hiermit, herauszufinden, welche Themen behandelt werden sollten und welche Keywords SEO-Chancen bieten könnten.

Weiterführende Links

Ähnliche Artikel

Über den Autor
Seobility S
Das Seobility Wiki Team besteht aus SEO-, Online-Marketing- und Web-Experten mit praktischer Erfahrung in den Bereichen Suchmaschinenoptimierung, Online-Marketing und Webentwicklung. Alle unsere Artikel durchlaufen einen mehrstufigen Redaktionsprozess, um Dir die bestmögliche Qualität und wirklich hilfreiche Informationen bieten zu können. Mehr Informationen über das Seobility Wiki Team.

Überprüfen Sie Ihre Webseite mit
dem SEO Check!