Hin und wieder mag es vorkommen, daß man eine Seite veröffentlicht hat, die man ungeschehen machen möchte. Für alle, die dieses Problem haben, habe ich die Nachricht, daß das gar nicht so einfach ist. Der Google Roboter hat ein gutes Gedächtnis, wenn nicht in den sogenannten Meta-Tags der Hinweis steht, daß der Roboter vergessen soll. Und das macht man entweder so << META NAME="ROBOTS" CONTENT="NOARCHIVE" >> (für alle Roboter) oder so << META NAME="GOOGLEBOT" CONTENT="NOARCHIVE" >>.
Das wäre ja ok, wenn dieser Eintrag in den Seiten drin ist --> vor der Veröffentlichung. Wer das nicht gemacht hat, hat nochmal eine Chance:
Wenn man den Namen weiß kann man die originale sogenannte "robots.txt"-Datei kopieren, sichern und dann verändern:
User-agent: *
Disallow: /adserver/
Disallow: /logs/
Disallow: /intern/privat/
Disallow: /config.php
Disallow: /zu_entfernende_datei.html
Dieses Wissen habe ich aus www.at-mix.de ... hilft aber nichts, wenn man den Dateinamen nicht rausfinden kann ....
Der Haken ist also: man muß den Namen der html-Datei kennen, die man entfernen möchte. Bei Blog-Dateien ist das nicht so einfach, weil der Name "irgendwie" aus der Überschrift entsteht. Wenn die html-Datei aber weg ist, wie soll man dann den Namen noch wissen? Den kann man aus dem Google-Link nämlich nicht ersehen
TrackBack Adresse zu diesem Eintrag:
http://www.elternrunde.de/cgi-bin/mt33/mt-tb.cgi/442
| So | Mo | Di | Mi | Do | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 |
