robots.txt для Битрикс

С недавних пор CMS «1С-Битрикс» стала при установке создавать robots.txt с отличным от прежней редакции содержимым.

Теперь в файле robots.txt можно увидеть такие директивы:

User-agent: *
Disallow: /bitrix/
Disallow: /search/
Allow: /search/map.php
Disallow: /club/search/
Disallow: /club/group/search/
Disallow: /club/forum/search/
Disallow: /communication/forum/search/
Disallow: /communication/blog/search.php
Disallow: /club/gallery/tags/
Disallow: /examples/my-components/
Disallow: /examples/download/download_private/
Disallow: /auth/
Disallow: /auth.php
Disallow: /personal/
Disallow: /communication/forum/user/
Disallow: /e-store/paid/detail.php
Disallow: /e-store/affiliates/
Disallow: /club/$
Disallow: /club/messages/
Disallow: /club/log/
Disallow: /content/board/my/
Disallow: /content/links/my/
Disallow: /*/search/
Disallow: /*PAGE_NAME=search
Disallow: /*PAGE_NAME=user_post
Disallow: /*PAGE_NAME=detail_slide_show
Disallow: /*/slide_show/
Disallow: /*/gallery/*order=*
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*register=yes
Disallow: /*forgot_password=yes
Disallow: /*change_password=yes
Disallow: /*login=yes
Disallow: /*logout=yes
Disallow: /*auth=yes
Disallow: /*action=ADD_TO_COMPARE_LIST
Disallow: /*action=DELETE_FROM_COMPARE_LIST
Disallow: /*action=ADD2BASKET
Disallow: /*action=BUY
Disallow: /*print_course=Y
Disallow: /*bitrix_*=
Disallow: /*backurl=*
Disallow: /*BACKURL=*
Disallow: /*back_url=*
Disallow: /*BACK_URL=*
Disallow: /*back_url_admin=*
Disallow: /*index.php$
Host: www.HOST.ru

Видно, что закрыли все служебные страницы Битрикса и дублирующийся контент. В целом, хорошо. Но, естественно, нужно внимательно просмотреть всё и адаптировать под конкретный проект. Например, предпоследняя строка запрещает индексацию всех index.php на сайте чтобы /dir/index.php не дублировала /dir/. Проверьте что у вас с адресацией и какие ссылки стоят. Понятно, что если в меню ссылаетесь на индекс, то запрещать его в роботсе не надо.

Ну, и по остальным директивам стоит пройтись взглядом перед запуском сайта.

Однако, в целом для сайтов на «1С-Битрикс» — хороший вариант чтобы не засорять выдачу мусорными страницами и немного снизить нагрузку на сайт от ботов. Единственное, я бы ещё добавил в самый конец файла директиву Sitemap со ссылкой на соответствующий файл карты сайта.

Интересная статья? Расскажи друзьям!