Материалы сайта
Это интересно
Лингвистика
2. Автоматизированные переводные словари. Принципы построения. АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях. АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ). Отличительные свойства АС: многоязычие обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса) гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь) динамичность (постоянное пополнение словарного состава; оперативность редактирования) состав (структура) словаря: макроструктура - структура словаря: микроструктура - структура словарной статьи основная единица словаря слово (композиционно) словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию 3 главных компонента АС: блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме) блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ) ( блок морфологического анализа) (иногда) блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя) Желательно также, чтобы АС обладал: блоком лемматизации алгоритмом обработки некорректных запросов алгоритмом словообразовательного анализа) АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста. На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме. решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики. Словарная статья: Ее структура и наполнение определяется назначением словаря. Структура словарной статьи (13 зон): 1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста 2. Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация. 3. Зона морфологической информации 4. Рубрика подрубрика стиль (вся информация - в виде цифровых кодов) 5. Зона индекса надежности отражает степень общепринятости данного ПЭ: А - официальный стандарт Б - уважаемые словари В - тетради новых терминов Г - плавающие 6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер) 7. Зона пояснительных помет - уточнение значения данной ЛЕ семантические лексические синтаксические (обязат. управление) 8. Зона толкований (для многозначных слов и новых терминов) 9. Зона примеров употребления выполняет две функции: иллюстративную смыслоразличительную 10. Зона фразеологии. 11. Составитель словарной статьи 12. Источник составления словарной статьи -> необязательные 13. Дата составления словарной статьи
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20