Search engine (поисковая система) - это..
КРАТКО:
Поисковая система (поисковая машина, поисковый сервер, поисковик, search engine) – это программно–аппаратный комплекс, позволяющий эффективно находить в глобальной сети информацию по ключевым словам, выступающим в роли поисковых запросов. Для сбора информации поисковые системы включают роботов, выполняющих переход од ссылки к ссылке, параллельный сбор и индексирование просмотренных документов.
ПОДРОБНЕЕ:
Поисковая система (поисковая машина, поисковый сервер, поисковик, search engine) – эффективный инструмент, при помощи которого выполняется поиск информации в глобальной сети. Работа поисковика состоит из двух основных этапов. На начальном поисковый робот, он же паук, червяк и т.п., обходит глобальную сеть и индексирует веб – страницы, собирая с них определенную информацию. При создании пользовательского запроса поиск осуществляется в рамках индекса, поэтому занимает значительно меньше времени. В результате формируется выдача поисковой системы, то есть упорядоченный список страниц, информация на которых соответствует посылаемому запросу.
По области действия все поисковые машины следует разделить на глобальные, обслуживающие всю глобальную сеть, и локальные, функционирующие в рамках национального домена или определенной языковой среды. Глобальные поисковики отлично функционируют в американском сегменте сети, а остальную часть «знают» на порядок хуже. Таким образом, если необходимая вам информация ограничена, скажем,русскоязычной средой, следует обратиться к русскоязычным локальным поисковым системам.
Глобальная сеть динамически изменяется, и этот процесс протекает быстрее, чем робот – сборщик сможет об этом узнать. Поэтому нередки ситуации, когда страницы из выдачи уже не существуют либо изменены. Часть поисковых машин сохраняет локальную копию или образ документа, проиндексированного ранее, поэтому именно его показывают пользователю в выдаче. Исходя из сказанного, скорость индексирования и обновления существующего индекса, а также его размер является важной характеристикой поисковика.
В результате поиска найденные ссылки на документы упорядочиваются по степени соответствия поисковому запросу; этот критерий называется релевантностью страницы. Для каждого поисковика технология определения релевантности является закрытой для сторонних лиц, поэтому позиция сайта в выдаче различных поисковиков может отличаться.
Обычно поисковик использует собственный или универсальный язык запросов, который точно указывает машине на характер искомой информации. Большинство поисковиков не требуют формальное знание такого языка от своих пользователей, создавая интерактивные надстройки или просто ожидая ввода ключевых слов в специальную форму. Наиболее совершенные поисковики ожидают простого запроса на естественном языке, при этом слова запроса автоматически сортируются по важности.
Поисковые машины в глобальной сети преимущественно выполняют поиск текстов; имеются, однако, специальные поисковики, перепрофилированные под поиск картинок, музыки или видео.
Сегодня проблема поискового спама является для всех поисковых машин одной из основных. Часть спамерских сайтов удается заблокировать и исключить из выдачи специальными алгоритмами, причем примененные к спамерам меры могут быть самыми разнообразными, вплоть до удаления адреса такого сайта из базы.