Индексация сайта в Яндекс
Индексацию сайта в Яндексе можно проверить следующим запросом:
При попытке аналогичного запроса, только используя домен с www:
...получим аналогичные цифры. Дело в том, что Яндекс отображает индексацию домена с учётом его "основного написания" ("склейки" - то, что обычно указано в robots.txt с помощью директивы Host). В редких случаях эти цифры (для случаев с www и без www) отличаются - это обозначает, что домен "расклеен" (или ещё "не склеен"), т.е. пока не пришёл волшебный робот-зеркальщик, который объединяет их в один вариант.
Индексация сайта в Google
Индексацию сайта в Google можно проверить следующим запросом:
А вот при попытке проверить аналогичный вариант, но с www (в отличие от Яндекса - для Гугля) уже получим совсем другие цифры:
В частности для данного сайта - это: Не найдено ни одного документа, соответствующего запросу site:www.noindex.by.
Дело в том, что Google показывает индексацию отдельно для обоих вариантов написания, не учитывая значение варианта отображения основного домена, что устанавливается в его админке.
Эту особенность обязательно нужно помнить и учитывать. Например, когда вы фильтруете в Sape своих акцепторов (или наоборот - отбираете потенциальных доноров для покупки ссылок), то очень часто оптимизаторы ставят ссылки не корректно - на отличный от "основного варианта написания домена". Это значит, что если по www.сайт в индексе Google будет 1-10 страниц, а "без www" - тысячи. И ссылка стоит как раз "на www". Что в свою очередь обозначает (для горе-оптимизатора), как минимум, её эффективность может быть ниже, а как максимум, при переусердствовании и некорректном robots.txt (где Яндекс не сможет корректно отловить директиву Host) - можно, вообще, "переклеить" сайт на противоположный вариант (обнаружив кучу ссылок на обратный вариант написания и отсутствии/некорректном Host - Яндекс "может передумать").
Кроме того, нужно также учитывать, что при проверке "без www" - Google включит в индекс и сумму всех значений имеющихся поддоменов. Потому чтобы получить точное значение проиндексированных страниц в Google при наличии поддоменов - нужно сложить варианты с www + без www и вычесть из них сумму индексаций всех поддоменов, что, логично, совсем не просто и не очевидно.
Последнее (неточность значения индексации Google при наличии поддоменов) - может сильно искажать цифры, что вы получаете от утилит и сервисов (той же упомянутой массовой проверки). Потому в идеале для определения индексации сайта в Google нужно проверять сразу оба варианта - и с www и без www. Однако такой подход в два раза увеличивает объём проверки и пока я не знаю ни сервисов ни ПО, что так умеет/делает (например, чтобы хотя бы примитивно выдавать сумму значений обоих вариантов)
Индексация сайта в Rambler
Индексацию сайта в Rambler можно проверить следующим запросом:
Возможно совсем скоро данная информация будет лишней :) (т.к. Рамблер, как известно, хочет присоединиться к судьбе Yahoo!, которого про-Bing-овали), однако всё же. Рамблер не умеет различать "основной-неосновной", потому в индексе у него "все" варианты. Это значит, что при адекватной индексации значение Rambler-индекса обычно должно быть где-то примерно в два раза больше, нежели значение индексации сайта в Yandex. Банально потому, что там будут два варианта. Его обычно нельзя сравнивать с индексацией в Google, т.к. из-за слишком уж отличающегося подхода/возможностей у Гугля это значение как правило выше (или много выше).
- 5025 просмотров


Ничего особенного, как правильно писать статьи уже не раз писалось на сайте.
С склейкой парятся те, кто переживает за правильную индексацию, поэтому наблюдаю "хороший тон", что многие биржи, которым это и не нужно- на склейку забивают. Я как-то выборочно прошелся и посмотрел кто и как у себя это сделал:
http://1-sites.info/page/skleivanie-domena-bez-www-c-www
Я вот не могу понять, есть ли значение проиндексирован сайт с www или без?
И наоборот, в случае выбора основного варианта без ввв, то при правильном подходе - проиндексированных с www быть не должно (запрос должен возвращать ноль).
На счет Рамблера не знала даже, спасибо! Хотя Рамблер и не так важен, конечно.
Подскажите, почему Рамблер первым проиндексировал все станицы, а потом за сутки абсолютно всё выкинул?
Рамблер - первым... Вынужден усомниться в корректности вопроса, ибо, условно говоря - "так не бывает". :)
Вот правильный запрос (подсмотрел на pr-cy.ru):
Спасибо за поправку - верно, такой вариант учитывает специфику вечной проблемы "с www и/или без www".
Отправить комментарий