Live Spam Screenshots

Google hat im vergangenen Jahr relativ viele Updates in die Algorithmen eingespielt, um vermehrt Spam zu bekämpfen. Der User der Suchmaschine soll nicht durch irgendwelche manipulierte Seiten abgeschreckt werden, die den Google-Bot täuschen und nur schlechte Ergebnisse nach vorne bringen. Der User soll Seite mit Mehrwert vorfinden, die auch echten Informationsgehalt beinhalten und dem Nutzer helfen. Laut Google werden täglich Millionen von Spam-Webseiten ins Netz gestellt, die keinerlei Nutzen haben, außer um die Suchergebnisse zu manipulieren, oder Schadsoftware zu vertreiben. Außerdem stellt Google Live-Spam Screenshots online, damit man exemplarisch die ausgeschlossenen Spam-Seiten sehen kann. Dabei gibt es verschiedene Arten von Spam, die aus den Suchergebnissen ausgeschlossen werden.

Spam nervt nicht nur im E-Mail Postfach, oder in den eigenen Kommentaren vom Blog, sondern auch die Suchmaschinen. Das Leben wäre viel leichter, wenn es keinen Spam gäbe. Zum Beispiel wäre diese Seite hier viel schneller entstanden, wenn ich mir nicht ständig Gedanken darüber machen müsste, wie ich am besten Spam vermeide, da die Spambots immer intelligenter werden. Es gibt mittlerweile Spambots, die Bildcaptchas entziffern können, wenn diese nicht so extrem verzerrt sind. Das ist schon eine beachtliche Leistung, da diese Daten nicht als Plain-Text (Klartext) vorliegen und aus den Pixeln ausgewertet werden können. Und so sehr wie Spam mich nervt, nervt er auch die Suchmaschinen.

Spam für die Suchmaschinen

Spam für Suchmaschinen ist sehr viel vielfältiger und noch aufwändiger, als der Spam mit dem sich Webseitenbetreiber, oder Email Nutzer. Mit Spam Seiten werden richtige Seiten imitiert und mit irgendeinem Text befüllt, der semantisch gesehen überhaupt keinen Sinn ergibt. Dies soll den Suchmaschinen Bot irreführen, dass jemand einen Text von beispielsweise 1000 Wörtern geschrieben hat und eine gewisse Anzahl davon Keywords besitzt, sodass die Relevanz für dieses Wort steigt und dieses auf eine andere Webseite verlinkt. Für die Suchmaschine ist dies nun ein Text mit einem relevanten Keyword und ein Link zu einer Seite, demnach ist die verlinkte Seite relevanter für dieses Keyword. So die einfache Logik dahinter – was aber in Wahrheit noch etwas komplizierter ist. Dies geschieht nun millionenfach, um Webseiten die eigentlich keinen guten Inhalt / Content hat in den Suchergebnissen nach oben zu treiben.

Kurz: die Suchmaschine wird ausgetrickst. Um diesen Betrug entgegen zu wirken und dem Nutzer wirklich relevante Suchergebnisse zu liefern, hat Google die Algorithmen demnach angepasst, die Inhalte von Webseiten korrekt analysieren zu können und auch erkennen zu können, wenn ein Text keinen Sinn ergibt. Allein dies ist eine erstaunliche Leistung, einer Maschine beizubringen semantisch korrekte, oder inkorrekte voneinander unterscheiden zu können. Doch das ist noch nicht genug: Mitarbeiter der größten Suchmaschine der Welt untersuchen auch manuell Webseiten nach Spam und strafen auch selbst ab, sollten sie solchen erkennen.

Doppelte Inhalte gelten auch als Spam!

Seiten, die Inhalte kopieren werden auch als Spam eingestuft, weil diese nicht exklusiv für diese Domain geschrieben worden sind und demnach auch keinen wirklichen Mehrwert bieten. Dies ist auch der häufigste Fehler, den ich so beachten konnte, dass viele Webseitenbetreiber Inhalte übernehmen, oder auch mehrere Domains zum selben Content führen. So ist auch eine Webseite unter zwei verschiedenen URLs erreichbar, hat aber die gleichen Inhalte. Natürlich wird dies auch als Spam gewertet und die Betreiber wundern sich, warum sie auf einmal aus den Suchergebnissen verschwinden. Die meisten denken dabei an die User, die sich unterschiedliche Domainnamen besser merken können, oder regional anders gefunden werden möchten. Hierbei wäre es besser erst gar nicht mehrere Domains auf den selben Content führen zu lassen und stattdessen eine Weiterleitung einzurichten, sodass nur noch eine einzige Domain mit den Inhalten gefunden werden kann.

Welche weitere Arten von Spam es gibt und zu den Google Spam Screenshots finden Sie hier:

http://www.google.com/insidesearch/howsearchworks/fighting-spam.html

Ersten Kommentar schreiben

Antworten

Deine E-Mail-Adresse wird nicht veröffentlicht.


*


Time limit is exhausted. Please reload CAPTCHA.