logo search
Билет_полн_текст

Поиск информации в интернете

Информация в Интернете хранится в виде сайтов.

Сайт – это набор гипертекстов, которые хранятся на некотором сервере под общим именем.

Гипертекст – это обычный текст, содержащий коды HTML.

Сайт состоит из нескольких гипертекстов, связанных взаимными ссылками.

Гиперссылка – это имена гипертекстов, расположенных на сайтах.

Для чтения гипертекстов используют специальные программы - браузеры.

Наиболее популярны:

Результат работы браузера – загрузка гипертекста по указанному адресу.

Если неизвестен адрес, то для поиска информации в Интернете используют:

Каталоги содержат:

Каталоги составляются редакторами, которые просматривают каждый новый сайт до его включения в каталог.

В процессе наполнения каталогов могут участвовать и разработчики сайтов при их регистрации в поисковых системах.

Интерфейс каталогов содержи список разделов, в котором отображены ссылки на URL – адреса наиболее важных документов. Каждая ссылка имеет аннотацию(краткое содержание документа).

В Российском секторе Интернета к крупнейшим каталогам относятся:

Каталоги позволяют найти сайты и зарегистрировать новые сайты и сервера.

Поисковые серверы Интернета делят на 2 группы:

Поисковые системы общего назначения позволяют найти документы в WWW по ключевым словам и/или с помощью иерархической системы каталогов.

Поисковые системы специального назначения позволяют искать информацию в виде файлов в архивах и системе поиска адресов электронной почты. Это Российская файловая поисковая система (WWW..files.ru) и {WWW.Filesearch.ru}.

БД поисковых систем заполняются роботизированными системами. Специальные программы – роботы (“пауки”) постоянно обходят Интернет в поисках новой информации, которую они вносят в БД.

БД в Интернете содержат URL – адреса и информацию, связанную с этими адресами.

Мощные “пауки” обходят Интернет за несколько дней.

Показателями качества поискового сервера являются:

YANDEX

RAMBLER

APORT

ОБЪЕМ БД на начало 2001г

Более 31 млн. документов

Более12 млн. документов

Более 14 млн. документов

Каталоги

17 разделов

56 разделов

14 разделов

Язык запросов

И(пробел, &)

ИЛИ(|)

И(AND, пробел, &)

ИЛИ(|, OR)

И(AND, пробел)

ИЛИ, OR)

Наиболее используемые русские поисковые системы:

Международные поисковые системы, которые имеют каталоги на русском языке:

Международные поисковые системы, которые позволяют делать запросы на русском, английском, испанском, французском и немецком языке:

В окне поисковой системы задаются ключевые слова.

Результат работы поисковой системы – перечень ссылок на гипертексты и сайты с их названием и краткой аннотацией.

Процесс загрузки WEB – страницы:

Если WEB – страница расположена на локальном компьютере, то в поле ”Адрес” вводят полной путь к файлу.

Кроме того, WEB – страницу можно загрузить командой ”Файл - Открыть”.

Установка правильной кодировки WEB – страницы:

WEB – страница – это текстовый файл с тэгами HTML, поэтому при просмотре русскоязычных страниц возникают проблемы с кодировкой, которые надо уметь менять.

Браузеры могут отображать информацию в любой кодировке.

Существует 6 различных кодировок: