Что значит disallow: /index.php?*

Что обозначает строка "disallow: /index.php?*" ?

Если вам помогла или просто понравилась статья - плюсаните/поделитесь, пожалуйста.

Данная строка в файле robots.txt запрещает к индексации все урлы, обычно генерируемые CMS типа Joomla, Wordpress, Drupal и большинство других.
Дело в том, что все вышеупомянутые движки поддерживают так называемые ЧПУ, в результате чего одна и та же страница получается доступной по "ЧПУ-адресу" и по "движковому" адресу (т.к. длинная строка в урле с "коряболками" как раз и используется самим движком в его работе). Т.е. получаем дублирование страниц на сайте, что так любит АГС. Потому с помощью "Disallow: /index.php" можно (и нужно) запретить все такие "дефолтные" адреса страниц, оставив для индексации лишь ЧПУ-образные (а ещё лучше-правильней поставить R301-переадресацию с "дефолтных" на "ЧПУ-шные").

Запись...

Disallow: /*index.php$

...что может означать, подскажите пожалуйста. Это в Битриксе.

Это может быть как запрет дубля главной страницы (которая доступна и по http://site.ru, и по http://site.ru/index.php - последний вариант и запрещается к индексированию, т.к. оба отображают одно и то же, т.е. дубль),  так и запрет дублей каких-то внутренних страниц (доступных и по http://site.ru/page, и по http://site.ru/page/index.php  - что также одно и то же).

Добавить комментарий

Подписка на Комментарии к "Что значит disallow: /index.php?*" Подписка на NOINDEX.by - Все комментарии