Keyword Density ist out, WDF*IDF ist das neue Non plus Ultra des SEO? Wenn man sich in verschiedenen Blogs so umschaut, so scheinen viele Autoren genau diese Meinung zu vertreten. Ganz so einfach ist es allerdings nicht, denn die Häufigkeit, mit der ein sinnstiftendes Wort in einem Text auftaucht, entscheidet immer noch über die Relevanz desselben - allerdings wird der Text nicht umso höher gerankt, je häufiger bestimmte Terms vorkommen. Im Gegenteil: Keywords und Nebenkeywords wollen in einer sorgfältig ausgewogenen Häufigkeit erscheinen, keinesfalls aber zu oft - dies nämlich kostet schlicht den erhofften Platz bei Google. Das Geheimnis des guten Rankings besteht ergo aus einem Mix aus Keyword Dichte und WDF*IDF.

Keyword Density - wie viel ist zu viel?

Der Begriff beschreibt, wie häufig ein Keyword - d. h. ein sinnstiftender Begriff, der bei Google & Co. als Suchbegriff fungiert - in einem Text vorkommt. Dabei geht es nicht nur um Hauptschlagwörter, sondern auch um Nebenbegriffe. So sollten etwa in einem Text über Honig nicht nur die Begriffe "Bienen" und "Imker" erscheinen, sondern auch "Waben", "Nektar" und "süßer Brotaufstrich". Bei der Erstellung eines Textes sollten die Begriffe in einem sorgfältig ausgewogenen Verhältnis erscheinen, allerdings nicht geballt und schon gar nicht so häufig, dass die Leserlichkeit des Dokuments darunter leidet. Die geballte Häufung von Keywords wird seitens der Suchmaschinen mit einem schlechten Ranking abgestraft - denn mittlerweile können diese dank gereifter Logarithmen themenrelevante Texte (auch bekannt als "Text mit Mehrwert für den Leser") von reinen SEO-Artikeln (Hauptsache, die Keywords reihen sich aneinander. Der Rest ist nur Füllmaterial.) hervorragend unterscheiden. Seitdem dieser Fakt bekannt ist, steigt die Nachfrage nach hochwertigen Inhalten, wobei viele SEO-Optimierer allerdings Qualität mit Quantität zu verwechseln scheinen. Ein Text mit Mehrwert muss nicht zwangsläufig 1000 Wörter umfassen, wenn das Thema nur 500 hergibt.

Und was ist nun mit WDF*IDF?

Hinter dem Kürzel WDF*IDF stecken eigentlich zwei Begriffe, die zu einem Logarithmus verbunden wurden. Mit dessen Hilfe sollen nicht nur die relevanten Keywords erschlossen werden - und deren Häufigkeit im Dokument - sondern auch, welche Begriffe tatsächlich einen Mehrwert für den Leser bieten.

WDF - Within-document Frequency

Die WDF zeigt die dokumentspezifische Gewichtung eines Wortes in einem Text an. Der Logarithmus errechnet im Prinzip auch nur die Keyword-Dichte, allerdings, und das kennzeichnet ihre Weiterentwicklung von der reinen Keyword Density, zeigt die Formel den WDF-Wert eines jeden Keywords innerhalb des Textes an. Damit entsteht eine schöne Übersicht, die deutlich anzeigt, welcher Begriff den Textinhalt am besten beschreibt, welcher am zweitbesten ... und so weiter. Auf diese Weise entsteht ein Grundgerüst, das den Inhalt des Dokuments grob skizziert und genau anzeigt, wie relevant eine Webseite tatsächlich für den gesuchten Begriff ist. Denn nur, weil in einem Text jeweils 10 Mal die Wörter "Bienen" und "Honig" auftauchen, muss es noch lange nicht um Imkerei gehen. Dies wird erst klar, wenn die Nebenkeywords ebenfalls analysiert und in Beziehung zu den Hauptkeywords gesetzt werden.

IDF - Inverse Document Frequency

Während sich dank der WDF-Formel ein Text noch schön klar in seine Grundbestandteile zerlegen lässt, wird es im zweiten Teil des Logarithmus deutlich komplizierter. Ab hier lässt es sich nämlich nur noch mit geschätzten Näherungswerten arbeiten, denn IDF zeigt an, wie häufig ein Begriff in allen bei Google gefundenen relevanten Webseiten (bzw. auf den dort aufgefundenen Texten) auftaucht. Dies ist natürlich unmöglich, denn niemand kann genau sagen, wie häufig etwa der Begriff "Biene" im gesamten Web erscheint. Daher sind bei der Berechnung dieses Wertes nur grobe Schätzwerte möglich, die allerdings, und das macht den Reiz der Angabe aus, sehr deutlich zeigen, dass häufige Suchworte wie etwa "Biene" weniger relevant sind als etwa ein spezieller Begriff aus der Imkerei, beispielsweise "Buckfast" (eine spezielle Bienenrasse). Anders ausgedrückt: Je konkreter ein Text ein bestimmtes Thema beschreibt, desto höher wird die entsprechende Webseite gerankt - und wie konkret ein Dokument tatsächlich ist, wird anhand der auftauchenden Fachbegriffe bestimmt.

Gemeinsam stark - Keyword Density und WDF*IDF

Nun wird deutlicher, weshalb die gute, alte Keyword Density noch nicht am Ende ist, denn sie ist schlicht und ergreifend in die WDF*IDF-Formel hinein gerechnet worden. Eigentlich handelt es sich um eine Erweiterung und Verfeinerung des bekannten Prinzips, nach dem die Häufigkeit der relevanten Keywörter das Ranking bestimmt. Im Gegensatz zur reinen Bestimmung der Keyword-Dichte ermöglicht es WDF*IDF nun allerdings, die tatsächliche Relevanz einer Webseite zu errechnen - es "gewinnt" also nicht mehr die Webseite mit den meisten Keywords, sondern die, die ihrem Leser einen wirklichen Mehrwert bietet. Somit zeigt uns WDF*IDF den Weg zurück von der Quantität zur Qualität - denn der Leser interessiert sich in erster Linie für den Inhalt.