fbpx

Information Retrieval

Home/Information Retrieval

Information Retrieval

Information Retrieval, auf Deutsch „Rückgewinnung von Informationen“, bezeichnet einen Prozess der Datenerfassung und -auswertung. Der Kerngedanke des Konzepts ist die Extraktion von Informationen aus einem großen und unsortierten Datenbestand, für den stetige Anfragen auf erfasste Informationen bestehen. Jede Suchmaschine wie Google oder Bing ist ein Information Retrieval System, das Suchanfragen von Nutzern auswertet und relevante Ergebnisse im Rahmen ihrer SERPs ausgibt.

Was leistet ein Information Retrieval System?

Die Erfassung von Informationen im Rahmen einer Datenbank oder eines anderen sortierten Verzeichnisses lässt sich in zwei grundlegende Schritte einteilen. Im ersten Schritt wird die Datenbank mit Informationen gefüllt, was im Falle des Such-Index von Suchmaschinen wie Google durch Crawling von IP-Adressen und Webseiten stattfindet. Diese Crawling muss in regelmäßigen Abständen wiederholt werden, da sich der gesamte Datenbestand an Webseiten stetig verändert. Täglich kommen neue Webseiten ins Netz, außerdem verändern sich die Inhalte bestehender Webseiten und machen ein erneutes Crawling für größtmögliche Aktualität notwendig.

Der zweite Schritt ist das Auslesen von Informationen aus einer bestehenden Datenbank. Dies entspricht der Suchanfrage von Internetnutzern, die nach relevanten Informationen zu bestimmten Begriffen und Themen suchen. Hier erfüllt die Suchmaschine ihre Aufgabe als Information Retrieval System, da eine Rückgewinnung der erfassten Informationen gewünscht ist. Orientiert an der Suchanfrage werden die im Such-Index gelisteten Seiten mit ihren Inhalten überprüft und in den SERPs relevante Webseiten sortiert ausgegeben.

Information Retrieval bei Suchmaschinen

Im Falle von Suchmaschinen ist die Rückgewinnung von Informationen an einige spezifische Rahmenbedingungen geknüpft. Ohne eine Erfüllung dieser Vorgaben wäre die Nutzung einer Suchmaschine wie Google in ihrer vertrauten Form nicht möglich:

  1. Der Datenbestand ist nicht gänzlich unsortiert. Zwar erfolgt die Erfassung neuer Webseiten beim Crawling zunächst ohne klare Sortierung. Vor Übergabe in den Such-Index findet allerdings eine Analyse der einzelnen Seiten in puncto Relevanz statt, wodurch sortierte Rankings bei entsprechenden Suchanfragen entstehen.
  2. Die Daten im Such-Index einer Suchmaschine haben nicht alle den gleichen Charakter. Neben Inhalten von Webseiten möchten Nutzer auf die gezielte Suche nach Bildern, Videos oder Produkten gehen. Dies berücksichtigen Suchmaschinen bei der Rückgewinnung von Informationen durch separate Suchbereiche.
  3. Im Vergleich zu anderen Datenbanken findet keine konkrete Anfrage auf einzelne Einträge im Such-Index statt. Vielmehr erfüllt die Suchmaschine den Zweck, auf intelligente Weise passende Einträge des Index einzublenden, die den Eingaben des Suchenden möglichst nahekommen und diesem einen Mehrwert zusichern.

Informationsrückgewinnung und SEO

Für die Suchmaschinenoptimierung (SEO) spielt ein Verständnis der Rückgewinnung von Informationen einzelner Suchmaschinen eine essenzielle Rolle. Alleine wenn die algorithmische Sortierung und Bewertung von Relevanz einzelner Webseiten verstanden wird, lässt sich eine Optimierung des Angebots im Sinne der Suchmaschine betreiben. Systematische Ansätze und Tools wie die WDF*IDF-Analyse helfen hierbei. Bei dieser werden Einträge im Such-Index in Relation zu anderen Einträgen des Index passend zum Suchbegriff ausgewertet.

Jetzt Potentialanalyse sichern