Entität

Aus Wiki
Wechseln zu: Navigation, Suche


Definition

Als Entität wird in der Informatik ein einzelnes, identifizierbares und separates Objekt bezeichnet. Dies können Einzelpersonen, Organisationen, Systeme, Datenbits oder einzelne Systemkomponenten sein, die für sich genommen von Bedeutung sind. Der Begriff Entität wird in der Informatik in einer Reihe von Programmiersprachen und -konzepten, im Datenbankmanagement, im Systemdesign und anderen Bereichen verwendet.

Eine Entität, die in einem Datenbank Management System (DBMS) gespeichert wird, kann Attribute und Beziehungen zu anderen Entitäten aufweisen. Im Open Systems Interconnection-Modell (OSI-Modell) der Informatik sind Entitäten diskrete Systemkomponenten, die unterschiedliche Protokolle verwenden, um miteinander zu kommunizieren. In der Objektorientierten Programmierung (OOP) wird das Wort Entität als Synonym für Objekte benutzt. Der gemeinsame Nenner aller Entitäten in der Informatik ist, dass sie als separate Einheit betrachtet werden können und einzigartige Merkmale besitzen.

Die Bedeutung von Entitäten in der SEO

Entitäten bilden die Basis für die semantische Interpretation von Suchanfragen durch Google und andere Suchmaschinen. Der Begriff "Semantik" bezieht sich im Allgemeinen auf die Bedeutung eines Begriffs. Bei der Suche im Internet bezeichnet "Semantik" im Wesentlichen das Studium von Wörtern und deren logische Zusammenhänge mit anderen Wörtern. Die semantische Suche ermöglicht durch die Einbeziehung von Informationen aus dem weiteren Kontext ein besseres Verständnis der Suchabsicht eines Nutzers (des sog. “Search Intents”). Suchmaschinen können so die Relevanz ihrer Antworten auf Suchanfragen verbessern.

Seit seinen Anfängen hat Google die Suchergebnisse nach dem Vorbild der natürlichen Konversation weiterentwickelt. Ein wichtiger Teil in Googles Strategie ist dabei die entitätsbasierte semantische Suche. Google definiert eine Entität in der Patentschrift "Ranking Search Results Based On Entity Metrics" als eine Sache oder ein Konzept, das einzigartig, klar definiert und unterscheidbar ist.

Bei der entitätsbasierten Suche nutzt Google verschiedene Kriterien zur Beurteilung der Beziehungen zwischen verschiedenen Entitäten. An erster Stelle steht hierbei die Relatedness, also die Verwandtschaft einer Entität mit einer anderen Entität. Durch den Vergleich der Häufigkeit, mit der eine Entität zusammen mit einer anderen Entität im Web referenziert wird, kann Google feststellen, ob diese miteinander verwandt sind.

Ein weiteres wichtiges Kriterium ist die Notability, also die Bekanntheit einer Entität und deren Wichtigkeit in Bezug auf eine Suchanfrage oder eine andere Entität. Google bewertet die weltweite Bekanntheit einer Entität beispielsweise anhand der Anzahl der Links oder Erwähnungen in den sozialen Medien.

Ein weiterer Faktor bei der Beurteilung einer Entität basiert auf externen Einflussfaktoren wie Reviews, Ranglisten und Ähnlichem. Dieser Faktor kann unterschiedlich gewichtet werden. Zum Beispiel hat eine kritische Bewertung eines bekannten Rezensenten einen höheren Einfluss auf die Bedeutung einer Entität als der Kommentar eines unbekannten Käufers.

Die semantische, auf Entitäten basierende Suche hilft Google unter anderem beim Erkennen und Disqualifizieren von Inhalten mit geringerer Qualität. Methoden wie Artikelspinning und Keyword-Stuffing lassen sich aufgrund fortgeschrittener Systeme, wie Latent Semantic Indexing (LSI) und Latent-Dirichlet-Allocation (LDA) leichter identifizieren und kennzeichnen. Dies bedeutet, dass Suchmaschinen wissen, welche Wörter statistisch betrachtet häufig zusammen vorkommen. Auf Basis dieser Kenntnisse können sie semantische Korrelationen herstellen, die sie bei der Bekämpfung von Spam verwenden.

Für die Suchmaschinenoptimierung (SEO) bedeutet dies, dass Entitäten von Google als solche erkannt und für die Bewertung von Websites herangezogen werden. Aufgabe in der SEO ist es deshalb, den Inhalt einer Website so zu gestalten, dass der Content nicht mehr nur für wenige Keywords erstellt wird, sondern im optimalen Fall den gesamten semantischen Raum eines Themas abdecken sollte.

Googles Knowledge Graph als Beispiel für die Anwendung von Entitäten

Seit 2012 zeigt Google bei vielen Suchanfragen eine Infobox zum gesuchten Begriff neben den Suchergebnissen an. Dahinter verbirgt sich der Knowledge Graph. Der Knowledge Graph von Google ist im Prinzip eine große Datenbank mit semantisch verwandten Entitäten, die von Google und seinen Diensten verwendet wird, um die Ergebnisse der Suchmaschine mit Informationen aus verschiedenen Quellen zu verbessern. Die Informationen im Knowledge Graph umfassen fast 600 Millionen Entitäten und mehr als 18 Milliarden Attribute, die von der Suchmaschine zur Identifikation der Beziehung zwischen den Entitäten und zur Beantwortung von Suchanfragen genutzt werden. Der Knowledge Graph enthält somit Millionen von Einträgen, die Entitäten in der realen Welt wie Menschen, Orte und Dinge beschreiben. Diese Entitäten bilden die Knoten des Graphen. Zu den gespeicherten Entitätstypen zählen unter anderem Buch, Buchreihe, Veranstaltung, lokales Geschäft, Film, Organisation, Person, Platz, Fernsehserie, Videospiel und viele mehr.

Knowledge Graph.PNG

Screenshot mit Knowledge Graph von google.com

Weiterführende Links

Ähnliche Artikel