Warum sprechende URLs für sich sprechen

Chio (admin) am 24.01.2008

Eine URL wie www.domain.de/kapitel/seite.php ist für Google ein klares Wort: 1 URL = 1 Seite = 1 Inhalt.
Hingegen ist etwas wie www.domain.de.index.php?p=123&u=24&sid=a0gfnasdg für Google sehr unattraktiv – weil problematisch: Die Seite könnte einen anderen Inhalt haben als .... sid=a0gfnasde – oder auch nicht. Um das zu erfahren, muss Google die Seite aber erst einmal laden und analysieren. Das kostet – Traffic und Rechenzeit. Wenn sich zb der Parameter sid bei jedem Besucher ändert, ist das ein Dilemma: Google sucht die bereits bekannten Seiten – findet sie auch – aber findet viele Links auf neue unbekannte Seiten, die es wieder zu untersuchen gilt:

Die Folge: Aus der Sicht des Google-Bots besteht eine eigentlich kleine Domain aus vielen Tausend Seiten = URLs, die er immer wieder und wieder herunterlädt.

Natürlich kommen auch bei WebsiteBaker URLs mit Parametern vor. Wichtig ist darauf zu achten, dass diese Parameter tatsächlich für einen bestimmten Inhalt stehen: 1 URL = 1 Seite = 1 Inhalt. In jedem Fall zu vermeiden: Irgendwelche Schleifen, in denen sich ein Bot verfangen kann. Das passiert zB. ganz einfach, wenn Parameter hochgezählt werden - ohne Ende.
Ein Beispiel: (nicht konkret auf WebsiteBaker bezogen): In einer Bildergalerie wird Bild 1 gezeigt, mit Link auf Bild 2 usw. Es sind nur 5 Bilder vorhanden, trotzdem enthält Seite 5 einen Link auf Seite 6: Auf der steht dann: „Leider gibt es kein Bild“ – trotzdem enthält die Seite einen Link zu Seite 7. Wieder: „Leider..“ und wieder ein Link: zu Seite 8.
Ein dummer Bot würde tausende - immer gleiche - Seiten laden.

Dabei ist es unfair, gerade Google für das Beispiel zu nehmen: Bei Google hat man das Problem zwar nicht ganz im Griff, aber weit besser als zb Yahoo oder gar MSN. Noch schlimmer sind all die kleinen Spambots, die schlecht programmiert auf der Suche nach Adressen, Inhalten sonst was unterwegs sind. Diese haben zwar nicht die Kapazität – aber die Masse kann einen Server völlig in die Knie zwingen. Überhaupt dann, wenn MSN gerade die vermeintlichen 20000 Seiten lädt.
Für den "normalen" Besucher äußert sich das dann als: Warten, warten, warten.... dann fehlen die Bilder.... warten, warten... Oder es kommt überhaupt nichts daher.

WebsiteBaker ist speziell bei SEOs (Suchmaschinen-Optimierer) für kleinere Projekte sehr beliebt, weil WB von Haus aus saubere, sprechende URLs erzeugt. Und zwar: ohne Löcher darin. Bei anderen Systemen kommt es immer wieder vor, dass zwar die URLs der obersten Ebene sauber sind, aber irgendwo tun sich Löcher ins System auf. Plötzlich findet der Bot URLs mit Parametern, die immer wieder so weitergereicht werden und dann schwillt die Domain auf das zig-fache an.

Speziell Typo3 ist so ein Kandidat.
Gib das mal bei Google ein:
site:www.jeff.at
Rechts oben: 982 Ergebnisse. Nie und nimmer hat diese Domain 982 Seiten. Wenn es 300 sind, sind es viel. Dabei ist Google noch brav; irgendwelche Spambots fressen rein, was das Zeug hält. Wenn das dann noch ein Provider ist, der seinen Kunden gerne Typo3-Hosting anbietet - und es laufen 100e weitere solcher Domains auf dem gleichen Server - dann sollte man an einen Providerwechsel denken.

Nachtrag

Die oben erwähnten 982 von Google erfassten Seiten von www.jeff.at sind mittlerweile auf etwa 300 geschrumpft. Google putzt immer wieder mal durch. In der nächsten Zeit wird die Seitenzahl wieder anschwellen, bis zum nächsten Kehraus.
Es ist leicht möglich, dass Google die Domain irgendwann als "insgesamt unzuverlässig" einstuft und nicht/kaum mehr in den Suchergebnissen listet.

Back

Comments

Keine gefunden

Add Comment



Websitebaker und Google

Bots lieben saubere URLs

Websitebaker ist eines der wenigen CMS, das von Haus aus saubere URLs erzeugt, in denen sich Bots nicht verfangen können. Das ist nicht nur für's Ranking in Suchmaschinen wichtig, sondern schont auch den Server und verhindert Wartezeiten.

  zurück    [ home ]   [ websitebaker ]   [ start ]

www.beesign.com - webdesign in wien