А. А. Рагойша поиск химической информации В интернете




Скачать 395.61 Kb.
PDF просмотр
НазваниеА. А. Рагойша поиск химической информации В интернете
страница6/34
А А Рагойша
Дата конвертации15.09.2013
Размер395.61 Kb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   34

2.4. Операторы расстояния
Сам факт одновременного присутствия неких терминов в записи со­
всем не обязательно означает, что эти термины связаны между собой по 
смыслу.   Например,   в   записи,   извлеченной   по   заданию  chromium   and 
phosphate
, может идти речь не о фосфате хрома, а о хромированном кор­
пусе анализатора бесфосфатных материалов. 
Информационный шум в значительной степени ослабляется, если при 
построении поискового задания  прибегнуть к  операторам расстояния 
(proximity operator), устанавливающим допустимое удаление терминов 
друг от друга и их порядок расположения в извлекаемых записях.
Для   обозначения   неизменяемой  фразы,   состоящей   из   нескольких 
слов, и неизменяемой строки символов почти все поисковые программы 
используют кавычки (чаще всего, двойные). 
Пример: по заданию "chromium phosphate"  ведется поиск таких за­
писей, в которых слова chromium и phosphate находятся в непосредствен­
ном соседстве, причем слово  phosphate  через пробел следует за словом 
chromium.
Пример: по заданию  "1,4-дибромбутен-2"  ведется поиск записей, в 
которых имеется именно такая, как указано внутри кавычек, последова­
тельность цифр, букв и знаков препинания.
То, что написано внутри кавычек, программа считает единым поис­
ковым термином, который можно объединять с другими терминами в ло­
гическое выражение.
Пример. По заданию "ion-selective electrode" and chloride извлекают­
ся   записи,   содержащие   одновременно:   а) текстовый   фрагмент  ion-
selective electrode
;   б) слово  chloride.   Записи,   содержащие   фрагмент 
ion selective electrode  без дефиса между первыми двумя словами, извле­
каться не должны — в этом случае нет 100 %-ного соответствия поиско­
вому термину.
Примечание. В некоторых старых программах вместо кавычек все еще 
используется оператор  adj  (т. е. запрос  НИИ adj ФХП  означает то же, 
что  "НИИ ФХП").
Для   обозначения   максимально   допустимой   удаленности   терминов 
друг от друга достаточно большое количество программ использует опе­
раторы near и with. К сожалению, пока что отсутствует стандартизация в 
их написании и значении: одинаковые по виду операторы могут выпол­
нять разные функции в разных базах данных, а для выполнения однотип­
ных действий могут использоваться разные операторы.
Наиболее   распространенный   формат  термин1 near/n термин2  или 
12

термин1 with/n термин2 (где n — целое положительное число) означа­
ет, что между первым и вторым терминами в тексте записи должно быть 
менее n иных слов.
Пример. По запросу chromium near/2 coating извлекаются записи, со­
держащие фрагменты chromium coating и chromium containing coating, но 
не извлекаются с фрагментом chromium forms a hard coating (термины из­
лишне удалены друг от друга).
Операторы near и with могут устанавливать и последовательность рас­
положения терминов в искомом документе (например, один из них раз­
решает любой порядок, а второй — только такой же, как в задании).
В некоторых базах данных с помощью операторов near и with указы­
вают, что связанные ими термины должны находиться в одном поле за­
писи; в одном абзаце; в одном предложении.
При формулировании запроса следует учитывать, что:
 в WWW используются разные варианты написания операторов рас­
стояния: w/n , with/n, with; near/n, near;
 операторы расстояния применяются для поиска только тех групп 
слов, которые находятся в одном и том же поле записи; 
 операции with/nnear/n и т. п. выполняются до операций notand и 
or;
 при выборе оптимальной величины  n  следует помнить, что, под­
считывая   расстояние   между   терминами,   программа   обычно   про­
пускает служебные слова (артикли, предлоги). 
2.5. Термины в поисковом задании
а) Шаблон
Для   полного   извлечения   полезной   информации   необходимо,   чтобы 
поисковое задание содержало в себе многочисленные варианты (грамма­
тические формы, а нередко и однокоренные слова) терминов, на основе 
которых базируется поиск. Разные методики применяются для того, что­
бы задание оставалось   компактным, но учитывало многовариантность 
слов; в одной из них этим целям служат шаблоны.
Шаблон  (wildcard) условным символом заменяет переменную часть 
термина.
Для обозначения одного переменного символа чаще всего использует­
ся   вопросительный   знак   (  ?  ).     Так,   например,   два   слова  leucocyte  и 
leukocyte  в   поисковую   фразу   могут   быть   внесены   как   один   термин 
leu?ocyte. Такой метод особенно полезен в тех случаях, когда требуется 
учесть отличия в английском и американском написании.
13
1   2   3   4   5   6   7   8   9   ...   34

Похожие:

А. А. Рагойша поиск химической информации В интернете iconКонспект урока «Поиск информации в сети Интернет»
Освоить работу по поиску информации в Интернете по ключевым словам и заданному адресу
А. А. Рагойша поиск химической информации В интернете iconУрок «Приёмы поиска информации в Интернете» Конспект урока «Глобальная сеть Интернет. Поиск информации в Интернете»
Цель урока: изучить структуру глобальной сети Интернет и освоить основные методы   поиска в сети
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете
Почему в качестве линий связи в компьютерных сетях чаще всего используются телефонные линии?
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете
...
А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете осуществляется с помощью специальных программ, обрабатывающих запросы информационно-поисковых систем (ипс). Существует несколько

А. А. Рагойша поиск химической информации В интернете iconПоиск информации в Интернете; анализ и обобщение собранной информации
Каждая краеведческая экспедиция, беседы со старожилами открывают что-то новое, требующее тщательного изучения. Сколько тайн хранят...
А. А. Рагойша поиск химической информации В интернете iconПлан открытого занятия студии ит по теме «Поиск информации в Интернете»
Оборудование: компьютеры, подключенные к сети интернет, мультимедийный проектор, интерактивная доска
А. А. Рагойша поиск химической информации В интернете icon1. Понятие информации.  Виды  информационных процессов. Поиск и систематизация информации. Хранение информации; выбор способа хранения информации.  Передача
Понятие информации.  Виды  информационных процессов. Поиск и систематизация информации. Хранение информации; выбор способа хранения...
А. А. Рагойша поиск химической информации В интернете iconИндексные поисковые сервера с русским интерфейсом
Поиск информации можно осуществлять, используя механизм информационных запросов. Он используется как для индексных поисковых машин...
А. А. Рагойша поиск химической информации В интернете iconРоссийская федерация закон о средствах массовой информации
В российской Федерации поиск, получение, производство и распространение массовой информации
Разместите кнопку на своём сайте:
kak.znate.ru


База данных защищена авторским правом ©kak.znate.ru 2012
обратиться к администрации
KakZnate
Главная страница