Файл robots.txt необходим для запрета индексирования поисковыми роботами всего сайта, каталога или отдельных страниц сайта.
Редактирование файла robots.txt
Примеры:
User-agent: *
Disallow:
Или можете просто создать пустой файл «/robots.txt».
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/
User-agent: *
Disallow: /
User-agent: BadBot
Disallow: /
User-agent: Yandex
Disallow:
User-agent: *
Disallow: /
Это довольно непросто, т.к. не существует инструкции “Allow”. Вместо этого можно переместить все файлы кроме того, который вы хотите разрешить к индексации в поддиректорию и запретить ее индексацию:
User-agent: *
Disallow: /docs/
Либо вы можете запретить все запрещенные к индексации файлы:
User-agent: *
Disallow: /private.html
Disallow: /foo.html
Disallow: /bar.html