Оптимизация структуры сайта (в друпале)

Крайне растяжимое понятие каждого из терминов может всё запутать. В данном случае речь идёт о том, что нужно "сделать" и "переделать", "запретить" и "зафиксировать" для сайта на движке Drupal с целью получения "SEO-выгоды".

Итак, одним из критически важных моментов для молодого сайта - есть планирование его будущей структуры. Ничего нового я этим не открою, однако это настолько важно, что не помешает ещё раз наступить на больной на, в частности, друпаловский, на мозоль.

Pathauto

Первым делом можно и нужно ориентироваться на качественную настройку модуля Pathauto, т.к. он является местом "схождения" настроек всех разделов сайта (форумы-блоги-юзеры-словари-термины-итп). Потому окончательно он может быть настроен лишь когда все эти моменты урегулированы. А важно получить именно "окончательный" вариант настроек модуля Pathauto, чтобы после его не трогать ни под каким предлогом (в плане изменений настроек, добавлять будет и можно и нужно).
Почему нельзя трогать? Потому что, к примеру, заменив способ формирования алиаса для какого-то словаря и его терминов, получится, что часть было сделано по "старым" правилам, а часть - по новым. В результате когда случится то, из-за чего придётся "перегенерить" все синонимы - поймёте, о чём идёт речь и пожалеете. Если это пять синонимов - одно дело. А если пять тысяч - будет очень жалко провалиться по куче позиций из-за того, что вновь сгенерированные синонимы "немножко отличаются" от предыдущих и по переходам из поисковика, в индексе которого погибшие "старые" варианты синонимов - получается постоянная Error404...
Это сложно - определиться со структурой. Я вот, к примеру, смотрю, уже набралось на сотню страниц (на этом блоге), а так и не определился с окончательно со структурой - используемые словари, как будет реализована в целом таксономия на сайте. Конечно, для блога - это не столь критично, потому я особо и не переживаю. Но по-любому, прямо только что, перед написанием данной статейки, зашёл в Pathauto, всё там ещё раз перепроверил (отписался, кстати, в комментарий) и больше туда ни рукой ни мышью.

robots.txt

Тоже важный момент, тоже желательно сделать и не трогать (лишь по мере надобности - добавлять исключения). Разберём на примере действующего (тут), можно глянуть по ссылке http://noindex.by/robots.txt

User-agent: *
Disallow: /database/
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /sites/
Disallow: /themes/
Disallow: /scripts/
Disallow: /updates/
Disallow: /profiles/
Disallow: /xmlrpc.php
Disallow: /cron.php
Disallow: /update.php
Disallow: /install.php
Disallow: /index.php
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
Disallow: /top-rated-
Disallow: /messages/
Disallow: /book/export/
Disallow: /taxonomy/
Disallow: /user2userpoints/
Disallow: /myuserpoints/
Disallow: /tagadelic/
Disallow: /referral/
Disallow: /aggregator/
Disallow: /user/login?
Disallow: /crss/
Disallow: /*destination=
Disallow: /*sort=
Disallow: /*order=
Disallow: /*title=
Disallow: /*/edit/
Disallow: /*/delete/
Disallow: /*/export/html/
Disallow: /*/edit$
Disallow: /*/outline$
Disallow: /*/revisions$
Disallow: /*/contact$
Disallow: /node/*/track$
Host: noindex.by

Наработанный годами вариант. Отражает многие проблемы (как тонкие, так и весьма "тостые" моменты), кто реально сталкивался - знает. Подробности - будут в отдельной статье, а пока можно просто пользоваться (только не забудьте заменить сайт после Host :) ).
Тут нет sitemap (он обязательно понадобится) - это тоже для отдельной статьи.
п.с. Последовательность, пробелы и регистры букв - лучше строго соблюдать (не менять).

Tagadelic (облако тэгов)

Весьма сложный (с точки зрения SEO) модуль, бездумное использование которого (особенно без вышеприведенного варианта robots.txt) - запросто может довести сайт до штрафных санкций со стороны ПС. Всё просто: тагаделики - не есть новый контент, это лишь перетусованный имеющийся. Потому с точки зрения ПС он (обычно) не несёт никакой ценности, в то время как (обычно) используется для "надувания" сайта (увеличения объёма), что расценивается как манипуляция и в лучшем случае - просто не попадут в индекс, в худшем - ещё хуже. :)
Это не значит, что облаком тэгов нельзя пользоваться. Наоборот, при грамотном подходе он, вместе с упомянутым Pathauto, а также (обычно) жизненно необходимым GlobalRedirect - и задают тот выгодный в SEO-плане вид сайта, удобный и для пользователей, и для ПС.
Опа, глянул, оказалось, что сам-то сюда и не поставил до сих пор GlobalRedirect. Сначала не понял, почему я так сделал, после - понял (склероз, блин). :) Но мой случай - исключение из правил, всё же ГлобалРедирект - положен по определению, это важный модуль в SEO друпала, посвятим ему также отдельную статью.

...Как-то со структуры скатился в чисто оптимизацию, переходящую в объём... Надо кусочками. Херим всё, после напишу по частям. Ладно, стирать не буду, кому интересно - считайте это "развёрнутым анонсом отдельных статей". :)

Если вам помогла или просто понравилась статья - плюсаните/поделитесь, пожалуйста.

Комментарии

А как настраивать robots.txt под мультисайтинг?

Этот вариант подойдет к любому сайту на друпале? Не учитывая мультисайтинг?

Спасибо за robots.txt. Наконец-то устранил все свои ошибки.

Спасибо, закинул к себе на 2-а друпальных блога.

Добавить комментарий

Подписка на Комментарии к "Оптимизация структуры сайта (в друпале)" Подписка на NOINDEX.by - Все комментарии