|
Поисковые сервера всегда перед индексацией вашего ресурса ищут в корневом каталоге вашего домена файл с именем "robots.txt" (http://www.mydomain.com/robots.txt). Этот файл сообщает роботам (паукам-индексаторам), какие файлы они могут индексировать, а какие нет.
Формат файла robots.txt - особый. Он состоит
из записей. Каждая запись состоит из двух полей:
строки с названием клиентского приложения (user-agent),
и одной или нескольких строк, начинающихся с
директивы Disallow: <Поле> ":"
<значение>
Пример:
Эта директива запрещает всем роботам это делать:
User-agent: *
Disallow: /
Данная директива запрещает всем роботам заходить
в каталоги "cgi-bin" и "images":
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Данная директива запрещает роботу Roverdog
индексировать все файлы сервера:
User-agent: Roverdog
Disallow: /
Данная директива запрещает роботу googlebot
индексировать файл cheese.htm:
User-agent: googlebot
Disallow: cheese.htm
|