
Поисковый алгоритм
Поисковый алгоритм – математическая модель, созданная специально для поисковой системы с целью выдачи наиболее релевантного контента, отвечающему по своему содержанию запросу пользователя. Задается целый ряд параметров, по которому оценивается контент. Особенности и специфика поисковых алгоритмов держатся в строгом секрете. Однако известны основные критерии, по которым осуществляется оценка релевантности контента. Среди них:
- дата создания сайта;
- доменное имя и доменная зона;
- общий объем ресурса (количество страниц, объем содержимого и др.);
- популярность тематики;
- соответствие информации, опубликованной на сайте, ключевым словам;
- общность стиля всех страниц сайта;
- индекс цитирования;
- авторитет ресурса в целом и авторитет отдельных страниц;
- периодичность обновления контента на сайте;
- дата последнего обновления информации на сайте;
- количество ключевых слов, их распределение на странице, процентное соотношение текста и ключей;
- использование метатегов;
- язык контента;
- географическое положение;
- качество внешних ссылок;
- объем внутренней и внешней ссылочной массы;
- комментарии в программном коде;
- наличие графики, фреймов, мультимедиа;
- наличие файла robots.txt;
- расстояние до ключевиков от начала текста;
- шрифт, форматирование, стиль и др.;
- глубина сайта, количество уровней и др.
Различают алгоритмы прямого и обратного индекса. В первом случае при запросе ключевого слова поисковый робот сканирует все документы, сохраненные в индексе системы. Из-за того, что при данном алгоритме приходится долго ждать результат выдачи, ведущие поисковые системы не используют его.
При алгоритме обратного или инвертированного индекса поисковая система всю информацию преобразует в текстовые файлы. В них располагается список слов с веб-ресурсов, их координаты и другие параметры. Из файлов формируется база, которая называется обратным индексом. Данный алгоритм позволяет на порядок быстрее осуществлять поиск релевантных страниц, однако, если говорить о качестве релевантности, то она чуть ниже, чем при использовании алгоритма прямого действия.