fbpx

Stemming

Home/Stemming

Stemming

Als Stemming wird eine Methode der Sprachwissenschaft bezeichnet, der Wörter auf einen gemeinsamen Wortstamm reduziert. Was über Jahrzehnte in der Linguistik als Verfahren zum Einsatz kam, ist heute auch für die Suchmaschinenoptimierung (SEO) und die Qualität von Suchmaschinen wie Google relevant. Ziel der Suchalgorithmen ist, durch das Betreiben des Stemmings bessere Suchergebnisse einzublenden, um weitere relevante Webseiten nach einer Suchanfrage anzuzeigen.

Welcher Grundgedanke steckt hinter Stemming?

Nutzer von Suchmaschinen machen sich im Regelfall wenig Gedanken, in welcher grammatikalischen oder syntaktischen Form Suchbegriffe eingegeben werden. So erwarten sie das gleiche, hochwertige Suchergebnis, egal ob ein bestimmtes Keyword im Singular oder Plural eingegeben wird. Gleiches gilt für sogenannte Komposita: Für die Suchanfrage „Immobilienkauf“ werden ähnliche Suchergebnisse erwartet wie bei Eingabe von „Immobilien Kauf“.

Damit hier identische oder fast identische Suchergebnisse entstehen, muss der Algorithmus hinter Suchmaschinen den gleichen Wortstamm bei eingegebenen Begriffen erkennen. Hierfür kommt das Verfahren der Wortstammreduktion zum Einsatz, das im Englischen Stemming genannt wird. Verschiedene Verfahren kommen seit Jahren bei Google, Bing und anderen Suchmaschinen zum Einsatz, speziell um bei längeren Suchbegriffen und ganzen Sätzen brauchbare Suchergebnisse zu erzielen.

Das Stemming-Verfahren im Überblick

Stemming-Verfahren sind vergleichsweise komplex und machen eine umfassende und detaillierte Analyse zahlloser Begriffe einer Sprache notwendig. Aus verständlichen Gründen lassen sich bestimmte Methoden und Analysen des Stemmings nur für eine bestimmte Sprache anwenden. Herzstück ist hierbei die Reduktion verschiedener Wörter auf einen gemeinsamen Bestandteil. Dies sind im Regelfall kurze Begriffe, die als eigenständiges Wort in der Sprache vorkommen.

In der deutschen Sprache funktioniert die Reduktion von Wortstämmen vor allem durch das Entfernen von Vor- und Nachsilben. Viele Wörter verfügen im Plural über Suffixe wie „-er“ oder „-en“, die gestrichen werden und den gleichen Wortstamm wie im Singular liefern. Im Deutschen existieren vergleichsweise viel Komposita, beispielsweise besteht das Wort „Fußballschuh“ aus drei eigenständigen Nomen. In anderen Sprachen sind komplexere Analyseformen durchzuführen, was im Deutschen für unregelmäßige Pluralbildungen wie bei „Baum“ und „Bäume“ gilt.

Stemming-Methoden und Suchmaschinenoptimierung (SEO)

Google vertraut seit über 15 Jahren auf verschiedene Stemming-Methoden, um seinen Nutzern bestmögliche Suchergebnisse zu liefern. Fokus liegt hierbei auf der Identifikation von Wortstämmen und der Isolation einzelner Wörter, die häufiger in Suchanfragen vorkommen. Selbst wenn komplexere Formulierungen und Sätze im Suchfeld zu finden sind, lassen sich diese durch das Verfahren auf Grundbegriffe und Wortstämme reduzieren.

Für das aktive Betreiben von SEO-Maßnahmen bedeutet dies, große Freiheiten bei der Formulierung von Begriffen im Text von Webseiten zu genießen. Ist eine Optimierung auf bestimmte Keywords hin gewünscht, dürfen ruhig grammatikalische Abwandlungen des Wortes vorkommen. Die Bildung des Plurals ist genauso erlaubt wie die Flexion. Selbst das grammatikalisch korrekte Zusammenschreiben von Komposita ist möglich, wonach die einzelnen Begriffe mit ihrem Wortstamm gewertet werden.

Die Nutzung dieser Freiheiten ist jedem Betreiber von Webseiten zu empfehlen. Ansonsten droht das Risiko, wie in früheren Jahren einzelne Keywords in der immer gleichen Form in Webseiten einzubinden. Dies kann bei einer höheren Anzahl von Google & Co. als Keyword Stuffing bewertet werden, was zu Penaltys der Suchmaschinen führt. Eine professionelle Webagentur kann bei der Keyword-Analyse professionell weiterhelfen.

Jetzt Potentialanalyse sichern