Предназначение и работа поисковых систем (часть 2)
Как происходит сканирование страницы?
Поисковый бот заходит на определенную страницу и начинает ее сканировать. Движок составляет список слов, которые присутствуют на странице и размещают эти слова в своей базе данных с определенными весовыми коэффициентами. Потом эти коэффициенты будут влиять на на позицию даной страницы в выдаче поисковика по определенному слову или словосочетанию, которое включает это слово.
Все поисковые системы пользуются разными системами "весов" для слов на странице. Но в основном они не раскрывают принцип начисления "весов", для того, чтобы программисты не могли искусственно повышать рейтинг сайта.
Но все же можно выделить некоторые общие моменты, которые, могут присутствовать во всех поисковиках при начислении "веса" слова и словосочетания.
- Слово, которое присутствует в заголовке страницы (тег title), получит значительно больший вес, чем это же слово, но внутри текста на странице.
- Слово, которое присутствует в тегах meta, добавит вес странице. Но так как слова которые находятся в этих тегах не отражаются пользователям, то у некоторых web-мастеров появляется соблазн разместить в них побольше различных слов. Из-за этого, появилось мнение, что поисковики уделяют им все меньше и меньше внимания.
- Слова в тегах H1, H2 и т.д. (в заголовках и подзаголовках) имеют повышенный вес.
- Выделенные слова (курсивом (тег I) или жирным (тег B)), могут быть более ценными для поисковика.
- Раньше считалось что слово, которое расположено в первых 20 строках на странице, является более "ценным" для поисковика. Но сейчас это наверное не имеет никакого значения. Хотя...
- Слово форма которого точно соответствует введенному в строке запроса, имеет значительно больший вес, чем другая форма этого же слова. Например, если пользователь ввел слово "курица", то оно будет иметь больший вес, чем слово "курицу".
Существует такое понятие как "вес слова на странице". Оно определяется отношением количества повторений определенного слова к общему количеству слов на данной странице. Раньше это было существенным фактором для поисковых систем. Но в наши дни они уделяют этому все меньше и меньше внимания.
Никто точно не знает какие параметры учитывают поисковики при оценке "веса" сайта. Скорее всего каждый из них создал свою систему, которая опирается как на перечисленные выше параметры, так и на свои уникальные параметры. Система вычисления "весов" держится в большом секрете. Конечно же, эти системы могут изменятся. Периодически технология подсчета корректируется, появляются новые параметры, меняются старые. Скорее всего, каждый поисковик создал свою собственную систему расчета "весов" слов на странице, которая базируется как на параметрах перечисленных выше, так и на других, уникальных для каждого поисковика значениях. Как я уже говорил, система расчета "весов" держится в строжайшей тайне. Конечно же, эти системы у поисковиков часто изменяются. Периодически технология подсчета изменяются, вводятся более новые параметры, корректируются старые.
Выдача результатов поиска
Теперь уже не трудно представить, что происходит, в строке поиска вводится запрос. Поисковик просто проводит поиск по своей базе данных. Он находит страницы, которые соответствуют запросу пользователя м выводит их в порядке убывания. Соответствие запросу называют - релевантностью страницы (page relevancy). Соответствие запросу вычисляется по определенным алгоритмам, часть которых мы описали вверху. Вот здесь уже применяются все "веса" и коэффициенты которые определились поисковым ботом при индексировании страницы.
Все становится значительно сложнее, если пользователь ввел не одно, а несколько слов. Здесь начинают действовать другие факторы. Например, то как близко размещены друг к другу слова на странице. Скорее всего, чем ближе в тексте искомые слова, тем релевантнее страница.
Все что было описано выше называется внутренними факторами, которые влияют на размещение страницы в выдаче поисковика. Но существуют также и внешнее факторы. У каждой поисковой системы есть свои параметры, по которым определяется популярность страницы в сети. У всех поисковиков они называются по-разному, но суть остается достаточно простой: чем популярнее сайт среди других участников сети, тем выше его возможность появится в выдаче поисковика.
И это на самом деле логично. Если на определенный сайт существует множество ссылок на других сайтах, то наверняка на нем размещена качественная и полезная информация. Хотя это не всегда соответствует действительности. Ведь именно на этом иногда выигрывают проекты, которые имеют хороший бюджет. Просто покупая множество ссылок с других сайтов они поднимают свой рейтинг в сети.

