| robots-dot-text | |||||
|
In der Datei "robots.txt", die auf der Root des Webservers/Webspaces abgelegt wird, kann man definieren, inwiefern die Spider (Robots) der Suchmaschinen Dateien auf dem Webspace/Webserver indizieren (in den Index der Suchmaschine aufnehmen und damit für Suchanfragen sichtbar) sollen. Möchte man, dass bestimmte Dateien von den Spidern ausgeschlossen werden, z. B. weil sie nicht öffentlich sind oder Zugriffsstatistiken enthalten, so kann man das in der "robots.txt" festlegen. Falls alle Dateien gespidert werden dürfen, so lautet der zu hinterlegende Text: User-agent:* Disallow: Falls kein Spider die Dateien indizieren darf: User-agent: * Disallow: / Falls nur bestimmte Dateien ausgeschlossen werden sollen, hier die Dateien "zähler.txt" und "statistik.php" → lautet die "robots.txt": User-agent: * Disallow: zähler.txt Disallow: statistik.php Falls beispielsweise die Spider von Google und MSN für das Verzeichnis /forum ausgeschlossen werden sollen, so sollte folgendes in der robots.txt stehen: User-agent: Googlebot/2.1 User-agent: WebMoose Disallow: /forum Es darf pro Domain nur eine "robots.txt" existieren. |
|||||
| Siehe auch: suchmaschinen Keywords Suchmaschinen-Ranking Robots Google Volltext-Suchmaschinen META-Suchmaschine | |||||