О каталогах и поисковых машинах
В Интернете, как известно, можно отыскать практически любую информацию. Вот только
сделать это не так-то просто. Ведь с точки зрения поиска информации Сеть представляет
собой нечто вроде громадной библиотеки, где на стеллажах в беспорядке навалены
отдельные страницы и более солидные фолианты (сайты), содержащие искомую
информацию. То, что она (информация то есть) здесь где-то есть, не вызывает никаких
сомнений. Вот только где? Неизвестно. Вот тут-то и возникает вопрос, мучавший своей
неразрешимостью российскую интеллигенцию, - 'что делать?" Ответ прост - делать надо то
же самое, что делают в обычной библиотеке, когда нужно найти требуемую книгу: следует
обратиться к библиотечному каталогу. Для этого существуют специальные Интернет-
ресурсы, выполняющие роль своеобразных 'библиотечных" каталогов и даже
'библиотечных коллекторов", собирающих данные о публикуемых материалах и
составляющих их аннотированные списки. Это собственно каталоги ресурсов Интернета и
поисковые машины, или. попросту, 'искалки" или 'поисковики".
Между этими двумя видами сетевых 'всезнаек" имеется достаточно большая разница.
Каталог ссылок, как и следует из названия, представляет собой упорядоченную по темам
коллекцию ссылок на многочисленные Интернет-страницы и сайты. Каталог, как правило,
составляется и поддерживается специалистами технической службы соответствующего
ресурса, которые самостоятельно и (или) по заявкам владельцев сайтов пополняют
перечень ссылок и составляют обзоры Web-страниц, включающие краткое описание
ресурса, его адрес в Интернете и определенные ключевые слова. Последние используются
поисковой программой, которая, как правило, входит в состав каталога. По этим словам
сайт может быть найден среди прочих ресурсов, описания которых имеются в базе данных
Интернет-каталога. Примером такого рода Интернет-ресурса является достаточно известный
в Рунете каталог ссылок List.RU (
http://www.list.ru/).
В отличие от каталога, поисковая машина не зависит от человека (это же машина!).
Поисковик включает в себя три основных компонента.
Во-первых, программу-робота, непрерывно просматривающую Сеть или определенную ее
часть (например, русскоязычные ресурсы) в поисках новых сайтов, а также с целью
проверки существования ранее найденных ресурсов.
Во-вторых, так называемый 'индекс" - базу данных, в которой хранятся сведения о
найденных Интернет-ресурсах.
И в-третьих, собственно поисковую систему - непременный элемент поисковика. Именно
поисковая программа осуществляет поиск по индексу с учетом заданных пользователем
критериев запроса.
Впрочем, нам с вами, как пользователям, не столь уж и важно знать о технических
подробностях функционирования подобных систем. Вот только, наверное, стоит
опровергнуть бытующий среди части пользователей стойкий миф о том, что поисковая
машина, для того чтобы найти требуемую информацию, 'перелопачивает" весь Интернет. На
самом деле по запросу пользователя поиск ведется по ключевым словам в индексной
базе. Кстати, подтверждением этому служат порой появляющиеся в результатах поиска
'мертвые" ссылки на уже несуществующие ресурсы.
Есть две бесконечности - Вселенная и глупость. Впрочем, я не уверен насчет Вселенной (с) Эйнштейн