Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар "Стратегия поиска в Интернет"




Скачать 251.1 Kb.
НазваниеПрограмма «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар "Стратегия поиска в Интернет"
страница1/5
Дата конвертации15.09.2013
Размер251.1 Kb.
ТипПрограмма
  1   2   3   4   5

Программа «Открытый мир – выпускникам»

Владимирская областная научная библиотека им. М.Горького

Центр открытого доступа Интернет ВОУНБ

Тренинг-семинар "Стратегия поиска в Интернет".

Занятие 2: Универсальные поисковые системы Интернет. Основы работы с интернет-файлами. (21 февраля 2006 г)

ПОИСКОВЫЕ СИСТЕМЫ



Информационно-поисковая система (ИПС) представляет собой автома­тизированную поисковую систему, реализованную на средствах электрон­ной вычислительной техники и предназначенную для поиска, а также выда­чи пользователям необходимой информации по заданным параметрам. Та­кой вид информационных служб WWW как «search engines» (буквальный перевод «поисковые машины») полностью удовлетворяет этому определе­нию, поэтому в дальнейшем мы будем употреблять термины «ИПС» и «ПС» как синонимы.

Основная функция ПС заключается в непрерывном сканировании про­странства WWW с помощью специальных программ-роботов, которые за­носят сведения о найденных документах в базу ИПС и обеспечивают ана­лиз и извлечение данных, описывающих содержание документа, по запросу пользователя. Работа программ-роботов строится по определенным алго­ритмам, которые и определяют различия между ПС. Чаще всего ИПС раз­личаются по охвату индексируемых документов или по специализации на определенных видах информации. По охвату индексируемых документов ПС делятся на глобальные, региональные и локальные. Специализация ИПС может осуществляться как на основе отбора документов определен­ной тематики, так и на основе отбора различных типов файлов.

Доступ к базам универсальных ПС является свободным. Пользователь формулирует запрос в рамках соответствующего поискового интерфейса и получает результат в виде списка ссылок на html-документы, отвечающие критериям запроса. Формат вывода результатов поиска может быть различ­ным.

На сегодняшний день количество ИПС, которые можно отнести к уни­версальным, исчисляется сотнями. В этот список не попадают региональ­ные поисковые системы, производящие фильтрацию документов по доме­ну верхнего уровня (например, DE — Германия, RU и SU — Россия, UK — Великобритания и т. д.). Однако они тоже обладают значительными масси­вами информации, сопоставимыми с масштабами глобального поиска. Ес­ли учесть и их, то количество ИПС, которым можно отправить запрос, вы­растет в несколько раз. Отсюда возникает необходимость выбора поиско­вой системы для дальнейшей работы.

Основными критериями при отборе ПС можно назвать следующие: объем базы ИПС, скорость обновления базы, принципы индексирования документов и возможность составления различных вариантов запроса, т. е. поисковые функции. Существует еще целый ряд критериев, таких как на­дежность и качество предоставляемой информации, степень ее актуально­сти, но они в настоящем издании не рассматриваются.

Объем является важнейшей характеристикой ИПС. Он измеряется ко­личеством проиндексированных в базе html-документов. Для глобального поиска информации лучше всего использовать поисковые системы, имею­щие объем не менее 100 миллионов web-страниц. Самые мощные на се­годняшний день ИПС — FastSearch, iWon, Google, Northern Light — рас­полагают сведениями о более чем 300 миллионах документов. Они предос­тавляют своим пользователям доступ к целой совокупности БД и иных информационных массивов как собственной генерации, так и принадлежа­щих другим ПС. Это происходит, как правило, на основе заключения парт­нерских договоров. Так, например, ИПС Inktomi вообще не имеет собствен­ного поискового интерфейса. Она заключает контракты с другими поиско­выми системами (HotBot, MSN Web Search и др.), давая возможность их пользователям проводить поиск в своей базе.

Несмотря на то, что каждая ИПС использует свои алгоритмы индекси­рования web-страниц, содержание их БД часто дублируется. По различным оценкам процент дублирования информации составляет от 5 до 30 %.

Информационное пространство WWW характеризуется высокой степе­нью динамичности. Это означает не только непрерывное поступление но­вых документов, но и исчезновение уже существующих. Поэтому основные задачи ПС состоят в своевременной индексации новых ресурсов и удале­нии из базы «мертвых ссылок». Как правило, чем ПС «моложе», тем больше в ней проиндексировано документов, появившихся за последнее время, и меньше неработающих ссылок. С другой стороны, уже не первый год существующие в сети ИПС также активно работают над поддержанием своей базы в актуальном состоянии .

Скорость обновления базы зависит от частоты, с которой програм­ма-робот может вновь вернуться к web-сайту. Эта частота изменяется в пре­делах от одного дня до нескольких месяцев. При этом страницы с более вы­сокой степенью посещаемости (трафиком) обследуются программой чаше.

Предполага­ется, что универсальные ПС индексируют документы вне зависимости от их географической принадлежности и языка. На самом деле программные средства той или иной ИПС имеют свою специфику. При отборе докумен­тов в базу используются дополнительные критерии, сведения о которых не всегда доступны. Тем не менее практика показывает, что поисковые систе­мы, созданные, например, в США, ориентируются преимущественно на англоязычные web-страницы. Документы на европейских и других языках мира представлены здесь в меньшей степени. Одна из крупнейших ИПС FastSearch, созданная норвежской компанией, тяготеет, наоборот, к евро­пейскому пространству WWW. Старейшая ИПС AltaVista достаточно ус­пешно находит документы на кириллице, однако ее возможности не могут сравниться с возможностями крупных отечественных ИПС (Апорт, Япёех, Rambler), которые индексируют русскоязычную область пространства WWW.

Помимо этого ПС могут различаться по глубине индексирования, т. е. могут индексировать либо все страницы web-сайта, либо только относя­щиеся к первым уровням (домашняя страница). Большинство ИПС индек­сируют от 50 до 100 страниц с одного сайта.

Статистические исследования возможностей самых мощных поиско­вых систем показывают, что реальная полнота охвата ресурсов WWW от­дельной ИПС не превышает 30 %4. Поэтому пользователям при поиске ин­формации необходимо использовать как минимум 2—3 поисковые систе­мы, отобранные по указанным выше критериям.


  1   2   3   4   5

Похожие:

Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconДепартамент культуры  администрации кемеровской области кемеровская областная научная библиотека ИМ. В. Д. Федорова кемеровская областная юношеская библиотека кемеровская областная детская библиотека ИМ. А. П. Гайдара
Цбс,   17   районных   цбс,   библиотека   г. Топки   является   самостоятельной 
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconДолжностная инструкция ответственного за организацию доступа к образовательным ресурсам сети Интернет и внедрение системы контентной фильтрации доступа к сети Интернет Общие положения
Ответственный за работу в сети Интернет и ограничение доступа к информационным интернет-ресурсам назначается на должность и освобождается...
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconСхема настройки доступа в Интернет для Windows 7
Заходим в панель управления, там открываем значок центр управления сетями и общим доступом / сеть и интернет
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconРегламент предоставления физическим лицам выделенного канала доступа к сети Интернет
Егламент определяет правила оказания Услуг по предоставлению доступа к сети Интернет по выделенному каналу (далее Услуги) физическим...
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconАрхангельская областная научная библиотека им. Н. А. Добролюбова  Информационная служба 
Оглавление  0 
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconРегламент работы точек доступа в сети Интернет Точки доступа к информационным Интернет-ресурсам в рамках реализации приоритетного рационального проекта «Образование»
Точки доступа к информационным Интернет-ресурсам в рамках реализации приоритетного рационального проекта «Образование» и программы...
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconВ сети интернет
Научить студентов использовать компьютерную сеть и Интернет для автоматизации процессов поиска и обмена информацией
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconРынок услуг по предоставлению доступа к сети Интернет
Аналитическая записка по оценке состояния конкурентной среды на рынке услуг по предоставлению доступа к сети Интернет на территории...
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconПрограмма «Открытый мир» и 
Программа «Открытый мир» ориентирована на молодых  политических и гражданских лидеров всех уровней 
Программа «Открытый мир выпускникам» Владимирская областная научная библиотека им. М. Горького Центр открытого доступа Интернет воунб тренинг-семинар \"Стратегия поиска в Интернет\" iconУрок «Приёмы поиска информации в Интернете» Конспект урока «Глобальная сеть Интернет. Поиск информации в Интернете»
Цель урока: изучить структуру глобальной сети Интернет и освоить основные методы   поиска в сети
Разместите кнопку на своём сайте:
kak.znate.ru


База данных защищена авторским правом ©kak.znate.ru 2012
обратиться к администрации
KakZnate
Главная страница