VIP STUDY сегодня – это учебный центр, репетиторы которого проводят консультации по написанию самостоятельных работ, таких как:
  • Дипломы
  • Курсовые
  • Рефераты
  • Отчеты по практике
  • Диссертации
Узнать цену
Главная / Рефераты / Дескрипторные информационно-поисковые языки

Дескрипторные информационно-поисковые языки

В основе построения дескрииторных ИПЯ лежит принцип координатного индексирования, который предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов. К ключевым словам ОТНОСЯТСЯ так называемые полнозначные слова— существительные, прилагательные, глаголы, наречия, числительные, местоимения. Ключевыми словами не могут быть предлоги, союзы, связки, частицы. Основными элементами ДИПЯ являются [29J: ¦ словарь лексических единиц; ¦ правила применения ИПЯ (грамматика), определяющие процедуру перевода текстов документов и запросов с естественного языка на ИПЯ: ¦ правила построения ИПЯ. (лопари лексических единиц делятся на две группы: 6-1297 162 ¦ основные лексические словари, составляющие лексику ИМЯ; ¦ морфологические словари, обеспечивающие морфологический анализ и нормализацию слов. В качестве лексических единиц основных словарей используются ключевые слова, словосочетания и дескрипторы. Дескриптор— понятие, обозначающее группу эквивалентных или близких по смыслу ключевых слов. Дескриптор -- это имя класса синонимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание [29). Разработка дескрппторного языка фактически сводится к разработке информационно-поискового тезауруса (ИПТ). Тезаурус (от греч. «хранилище», «сокровищница») в узком смысле представляет собой специальный словарь-справочник, в котором перечислены ключевые слова — дескрипторы определенной предметной области, указаны их синонимы, установлены способы устранения синонимии, омонимии, полисемии, определены родовидовые и ассоциативные связи дескрипторов [29]. Наиболее важными парадигматическими отношениями ИПТ являются: ¦ соподчинение; ¦ род-вид; ¦ часть—целое; ¦ причина-следствие; ¦ функциональное сходство. Обобщенная структура ИПТ включает как минимум три составляющих: словарную часть, семантическую карту, руководство по использованию. Приведем ряд определений [29]. Словарная часть алфавитный список дескрипторов с их словарными статьями. Семантическая карта — система тематических классов дескрипторов, представленная в виде графической схемы или таблицы. Руководство по использованию ИПТ содержит правила перевода ключевых слов и словосочетаний на ИПЯ, правила лексикографического контроля и редактирования ПОД и ПОЗ, а также правила ведения ИПТ. Отличием информационно-поисковых тезаурусов от информационно-поисковых каталогов на основе предметной иерархической рубрикации является то, что в тезаурусах, помимо классификационной 163 схемы, присутствуют сами ключевые слова и дескрипторы, объединяемые под названием классов, рубрик и т. д. В каталогах же присутствуют только лишь обозначения (названия) классов. Главная идея информационно-поисковых тезаурусов заключается в повышении эффективности индексирования документов в рамках дескриптивного подхода. Иначе говоря, в системах на основе ПИТ ПОД представлен набором дескрипторов. Однако в процессе индексирования документов учитываются семантические отношения междудескрипторами, что, В конечном счете, обеспечивает более адекватный содержанию документа ПОД и повышает эффективность поиска документов. Форма представления тезауруса включает алфавитное перечисление статей по каждому дескриптору (термину) в следующем виде1: реферат: с: резюме; в: свертывание информации; н: реферат авторский: реферат графический; реферат информативный; реферат «телеграфного стиля»; реферат указательный; реферирование; а: аннотация В качестве буквенных обозначений здесь выступают следующие: с — термины-синонимы; в — термины, подчиняющие заглавный термин: н — термины, подчиненные заглавному; а — термины, ассоциированные с заглавным термином. Различают базовые и рабочие тезаурусы. Базовые тезаурусы включают ОСНОВНОЙ набор лексики предметной области. Рабочие тезаурусы строятся на основе базовых тезаурусов и дополняются в процессе индексирования документов новыми терминами. 1 Источите Гайдамакин Н. А. Автоматизированные информационные системы, балы и банки данных. Вводный курс: Учебное пособие. — М.: Гелиос АРВ, 2002.

Каталог работ Узнать цену


Похожие рефераты:

Отзывы

Спасибо, что так быстро и качественно помогли, как всегда протянул до последнего. Очень выручили. Дмитрий.

Далее
Узнать цену Вашем городе
Выбор города
Принимаем к оплате
Информация
Наши преимущества:

Оформление заказов в любом городе России
Оплата услуг различными способами, в том числе через Сбербанк на расчетный счет Компании
Лучшая цена
Наивысшее качество услуг

Сотрудничество с компаниями-партнерами

Предлагаем сотрудничество агентствам.
Если Вы не справляетесь с потоком заявок, предлагаем часть из них передавать на аутсорсинг по оптовым ценам. Оперативность, качество и индивидуальный подход гарантируются.