А. А. Рагойша поиск химической информации В интернете




Скачать 395.61 Kb.
PDF просмотр
НазваниеА. А. Рагойша поиск химической информации В интернете
страница7/34
А А Рагойша
Дата конвертации15.09.2013
Размер395.61 Kb.
ТипДокументы
1   2   3   4   5   6   7   8   9   10   ...   34

Для обозначения любого количества символов (в том числе, нулевого) 
обычно  используется  звездочка  (asterisk)  *.  Этот   шаблон  —  усечение 
(truncation) — чаще применяется в конце слова (right hand truncation), 
но некоторые программы разрешают использовать его и в середине, и в 
начале слова. Шаблон позволяет включить в один поисковый термин все 
грамматические   формы   слов   (например,   не   перечислять  phosphate  и 
phosphates,   а   записать  phosphate*)   или   однокоренные   слова   (не 
phosphorusphosphorousphosphoricphosphates, а только phosph*). 
Если правая часть поискового термина заменяется шаблоном, в левой 
части должно оставаться не менее трех букв.
При выборе шаблона  следует быть осмотрительным, так как суще­
ствует вероятность неожиданного увеличения информационного шума. 
К примеру, по заданию  chlor*  можно получить не только материалы о 
chlorine,  chloride,  chlorate,   но   и   о   далеком   по   смыслу,   но   созвучном 
chlorophyll.
Пример. Найти информацию о бессиликатных покрытиях или связую­
щих на основе фосфатов магния или  хрома. На этот раз приведем окон­
чательный вариант запроса, пригодный для использования в реальном 
поиске:
— со всеми операторами
(coating* or binder*) and (magnesium or chromium) and phosphate* not 
silicate*

— для программ, в которых and является оператором по умолчанию 
(coating* or binder*) (magnesium or chromium) phosphate* not silicate*
Обе формы учитывают возможность присутствия в записях имен су­
ществительных в единственном и множественном числах (катион в на­
звании соли может быть только в единственном числе).
Шаблон * в середине и начале слова сильно увеличивает длительность 
поиска, поэтому при работе в Интернет по возможности следует избегать 
такого его применения.
Замена букв на шаблон внутри кавычек не допускается. (Редкие ис­
ключения из этого правила будут обсуждаться при рассмотрении кон­
кретных баз данных).
б) Учет словоформ (stemming)
Многие из современных программ способны самостоятельно расши­
рять задание, варьируя окончания (иногда и суффиксы) слов запроса; та­
кой режим учета словоформ терминов называется stemming (от stem — 
основа). Например, при использовании в качестве поискового термина 
слова   boiling  по этому алгоритму извлекаются записи со словами  boil
14

boilsboiledboilerboilers
Программы, по умолчанию работающие в режиме  stemming, обычно 
содержат средства его отключения — либо для отдельного термина по­
искового задания (в этом случае термин необходимо отметить условным 
знаком), либо для всего запроса (с помощью переключателя, кнопки и 
т. п., имеющихся на поисковом бланке). Такая необходимость может воз­
никнуть, если читатель проводит узконаправленный поиск по четко вы­
бранному набору слов.
Пример. В запросе о температуре кипения вещества следует учесть, 
что в искомой статье слово температура может быть в любом падеже, 
но слово кипения должно присутствовать только в одной грамматической 
форме, а именно в родительном падеже единственного числа.
в) Регистр букв (Case Sensitivity)
Обычно для поисковой программы строчные и заглавные буквы абсо­
лютно эквивалентны (case insensitive). Например, в задании можно запи­
сать либо bell, либо BELL, либо даже beLL — итог будет один и тот же: 
пользователь получит информацию об авторе по фамилии Bell, о компа­
нии  Bell Communications Research, Inc., о колоколах, куполах, конусах 
(bell). (Более избирательного результата добиваются, указывая поля, в 
которых планируется вести поиск — об этом см. п. 2.7).
Программы,  чувствительные к регистру, т. е. различающие строч­
ные   и   заглавные  буквы,   (case   sensitive),   все   же   существуют,   поэтому 
пользователь   должен   узнать   заранее,   как   проводится   поиск   по   имени 
собственном в конкретной базе данных.
г) Стоп-слова (Stopwords)
В каждом языке есть служебные слова, которые используются часто, 
но сами не несут большой смысловой нагрузки: артикли, предлоги и т. д. 
Для того чтобы ускорить процесс обнаружения требуемой информации, 
поисковая программа может игнорировать присутствие таких слов и в 
запросе, и в анализируемых документах. Термины, которые исключают­
ся из поиска, называются стоп-словами (stopword).
Примеры стоп-слов: a, the, of (англ.); в, из, над (рус.).
Реакция на стоп-слово внутри кавычек бывает разной: одни програм­
мы его отбрасывают, другие учитывают при поиске.
Достаточно большое количество программ, особенно из числа обслу­
живающих научные базы данных, не разделяет слова на полноценные и 
неполноценные и допускает поиск по любому термину, в том числе со­
стоящему из одной буквы или цифры.
15
1   2   3   4   5   6   7   8   9   10   ...   34

Похожие:

А. А. Рагойша поиск химической информации В интернете iconКонспект урока «Поиск информации в сети Интернет»
Освоить работу по поиску информации в Интернете по ключевым словам и заданному адресу
А. А. Рагойша поиск химической информации В интернете iconУрок «Приёмы поиска информации в Интернете» Конспект урока «Глобальная сеть Интернет. Поиск информации в Интернете»
Цель урока: изучить структуру глобальной сети Интернет и освоить основные методы   поиска в сети
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете
Почему в качестве линий связи в компьютерных сетях чаще всего используются телефонные линии?
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете
...
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы информационно-поисковых систем (ипс). Существует несколько

А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете; анализ и обобщение собранной информации
Каждая краеведческая экспедиция, беседы со старожилами открывают что-то новое, требующее тщательного изучения. Сколько тайн хранят...
А. А. Рагойша поиск химической информации В интернете iconПлан открытого занятия студии ит по теме «Поиск информации в Интернете»
Оборудование: компьютеры, подключенные к сети интернет, мультимедийный проектор, интерактивная доска
А. А. Рагойша поиск химической информации В интернете icon1. Понятие информации.  Виды  информационных процессов. Поиск и систематизация информации. Хранение информации; выбор способа хранения информации.  Передача
Понятие информации.  Виды  информационных процессов. Поиск и систематизация информации. Хранение информации; выбор способа хранения...
А. А. Рагойша поиск химической информации В интернете iconИндексные поисковые сервера с русским интерфейсом
Поиск информации можно осуществлять, используя механизм информационных запросов. Он используется как для индексных поисковых машин...
А. А. Рагойша поиск химической информации В интернете iconРоссийская федерация закон о средствах массовой информации
В российской Федерации поиск, получение, производство и распространение массовой информации
Разместите кнопку на своём сайте:
kak.znate.ru


База данных защищена авторским правом ©kak.znate.ru 2012
обратиться к администрации
KakZnate
Главная страница