Проверка файла robots.txt

Большинство современных сайтов построено с помощью систем управления контентом или, проще говоря, "движков". Ключевой особенностью таких систем является то, что страницы такого сайта создаются динамически на основе шаблонов и информации из базы данных. Такой подход обеспечивает очень гибкое и удобное управление сайтом, но при этом сайт будет содержать различного рода служебные файлы. Например, php скрипты, конфигурационные файлы, файлы шаблонов. Эти файлы невидимы для обычного пользователя (если он использует только ссылки размещённые на самом сайте), но могут быть проиндексированы поисковыми роботами.



Индексация таких файлов крайне не желательна, т.к. они не содержат вообще никакой полезной информации (тексты статей, комментарии и т.п. обычно находятся в базе данных), а трафик потребляется.



Файл robots.txt содержит набор правил, которые позволяют закрыть любые служебные каталоги сайта для индексирования.



Подходить к созданию такого файла нужно очень внимательно, т.к. можно легко скрыть страницы с полезным контентом.



В первую очередь можно поискать готовый файл robots.txt для вашего движка (для wordpress я нашел штук 5 разных файлов). После этого, проверьте, что все ко всем каталогам со служебными файлами закрыт доступ.



Следующим этапом будет проверка синтаксиса файла. Её удобно выполнять с помощью службы Яндекса (http://www.yandex.ru/cgi-bin/test-robots).



Теперь самое главное. Нужно проверить, что все страницы нашего сайта доступны для роботов. Тут удобно использовать службу Google webmasters tools (https://www.google.com/webmasters/tools/siteoverview?hl=ru). Для её использования вам придётся создать аккаунт и подтвердить право собственности на сайт (для этого нужно разместить файл со специальным именем в корне сайта).



Советую почитать "Все о файле robots.txt" и статью "Как проверить файл robots.txt".



Вот и все. Успешного "сайтостроительства".

Comments are closed.


SiteMap: http://www.internet-internet.info/ http://www.internet-internet.info/?p=29 http://www.internet-internet.info/?p=3 http://www.internet-internet.info/?p=9 http://www.internet-internet.info/?page_id=2 http://www.internet-internet.info/?p=10 http://www.internet-internet.info/?p=8 http://www.internet-internet.info/?p=13 http://www.internet-internet.info/?p=11 http://www.internet-internet.info/?p=12 http://www.internet-internet.info/?p=23 http://www.internet-internet.info/?p=34 http://www.internet-internet.info/?p=46 http://www.internet-internet.info/?p=42 http://www.internet-internet.info/?p=37 http://www.internet-internet.info/?p=45 http://www.internet-internet.info/?p=28 http://www.internet-internet.info/?p=39 http://www.internet-internet.info/?p=26 http://www.internet-internet.info/?p=31 http://www.internet-internet.info/?p=40 http://www.internet-internet.info/?p=22 http://www.internet-internet.info/?p=44 http://www.internet-internet.info/?p=7 http://www.internet-internet.info/?p=32 http://www.internet-internet.info/?p=21 http://www.internet-internet.info/?p=38 http://www.internet-internet.info/?p=20 http://www.internet-internet.info/?p=36 http://www.internet-internet.info/?p=33 http://www.internet-internet.info/?p=41 http://www.internet-internet.info/?p=24 http://www.internet-internet.info/?p=27 http://www.internet-internet.info/?p=30 http://www.internet-internet.info/?p=25 http://www.internet-internet.info/?p=35 http://www.internet-internet.info/?p=43 http://www.internet-internet.info/?p=18 http://www.internet-internet.info/?p=47 http://www.internet-internet.info/?p=19