Seit August versuche ich diese Site aus den Indices von Gogle, Bing etc. herauszubekommen. Ich habe dabei gelernt, das noindex
und Direktiven in der robots.txt
witzlos sind. Daher probiere ich es jetzt mal direkt mit einem 404 für diese Crawler. Im apache2 mit aktiviertem mod_rewrite sieht das so aus:
RewriteCond %{HTTP_USER_AGENT} Google [NC,OR]
RewriteCond %{HTTP_USER_AGENT} bing [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Baidu [NC,OR]
RewriteCond %{HTTP_USER_AGENT} chatgpt [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Yandex [NC]
RewriteRule ^ - [R=404,L]
Mehr als ein „hier gibt es nichts zu sehen“ direkt in die Schnauze des Crawlers fällt mir dann aber erst mal auch nicht mehr ein.