Основной индекс Гугла (Google Main Index) - способы получения

Основной индекс Гугла (Google Main Index)

Не основной индекс Гугла был рассмотрен в предыдущей статье - "Google supplemental index - история, практика, загадки и разгадки", теперь подробней остановимся на основном - Google Main Index.

Какой способ получения основного индекс "правильный"? Не будем искать "самый правильный", перечислим все известные на данный момент.

site:домен/&

Самый популярный вариант получения основного индекса Google, потому "по умолчанию" использую его и буду подразумевать его использование в дальнейшем.

http://www.google.com/search?hl=ru&q=site:noindex.by/%26

site:домен/*

Второй по распространённости способ:

http://www.google.com/search?hl=ru&q=site:noindex.by/*

site:/домен

http://www.google.com/search?hl=ru&q=site:/noindex.by

Не шибко распространённый способ, результаты обычно аналогичны предыдущему (site:домен/*) способу.

Альтернативные способы получения основного индекса Google

google.com.supplemental

Один из них был разобран в статье про дополнительный индекс, с помощью которого можно использовать различное написание, например, использовать "оператор" google.com.supplemental:

site:noindex.by -google.com.supplemental
Результатов: примерно 199 (0,10 сек.)

Кстати, хорошее название получилось для supplement_index-оператора, можно его использовать всегда для пущей понятности.

search.icq.com

Есть такой поисковик. Хотя подойдёт и другой, использующий движок Google. Что имеем:

http://search.icq.com/search/results.php?q=site%3Anoindex.by
Результаты 1 - 10 из примерно 179

Тоже какое-то "интересное" значение. В случае данного сайта "похожесть" как раз лишь "случайная", просто нужно отметить именно радикальное отличие данных значений от тех, что отдаёт та же команда в Google. Ещё раз повторюсь, речь о "псевдопоисковике" - использующем движок Google, а значит, вроде как и команды и значения по ним должны "соотноситься".

 
p.s.

Целью статьи не было что-то доказать, а (пока) лишь рассказать, т.к. сваливать всё в кучу - совсем будет не понятно. Кому совсем не понятно - сначала почитайте предыдущую статью. Кому понятно, но есть вопросы - вопрошайте (здесь). В любом случае, продолжение - следует.

Комментарии

Я что-то не понял, это описано, как узнать, какие страницы находятся в основном поиске?

Если под "основным поиском" подразумевается "основной индекс" (Google), то - да.

Со времени написания статьи прошло полгода. Отчитываюсь по результатам проверки-сравнения различных способов получения Google Main Index. Для данного сайта имеем следующую картинку:

Сравнение различных способов получения Google Main Index

Видно, что динамика всех трёх показателей строго одинаковая (отличие абсолютных значений /&-способа указывает лишь на наличие дублей). Отдельно стоит отметить показания индекса сайта по icq.com, которые нельзя считать "строго одинаковыми" с другими способами, т.к. в случае данного сайта это просто совпадение. Например, для другого сайта, у которого много больше страниц, имеем следующий график:

Сравнение различных способов получения Google Main Index - 2

Видно, что с некоторыми оговорками, но (именно) динамика у icq.com - точно та же. Некоторые провалы - можно списать на проблемы самого сайта (в смысле icq.com) плюс стоит выделить некоторую "опережающе-прогнозную" составляющую его значений.

Также видно, что при больших абсолютных значениях (читай - крупный-популярный сайт), разницу между способами /&, /* и / можно не учитывать вообще. Кроме того, по результатам своих длительных и пристальных наблюдений, последний способ (site:/домен) - мне кажется наиболее "правильным".

Добавить комментарий