На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Публикации
Компьютерная лингвистика

Публикации

























Компьютерная лингвистика



Ермаков А.Е., Плешко В.В. Семантическая интерпретация в системах компьютерного анализа текста
Информационные технологии. - 2009. – N 6.
В статье описывается подход к построению семантического компонента в системах компьютерного анализа текста на естественном языке. Подход основан на применении специальных шаблонов к сети синтактико-семантических отношений между словами текста, которая строится синтаксическим анализатором. Шаблоны определяют способ интерпретации фрагментов сети в заданные фреймы, с идентификацией участников ситуаций и их ролей.


А.Е. Ермаков Автоматическое извлечение фактов из текстов досье: опыт установления анафорических связей
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2007. – Москва, Наука, 2007
Доклад описывает опыт решения задачи автоматического извлечения фактов из текстовых документов особого стиля - досье. Описываются использованные для поиска фактов средства на основе синтаксического анализатора и синтактико-семантических шаблонов. Особое внимание уделяется закономерностям организации дискурса, использованным для установления анафорических связей.


Ермаков А.Е., Киселев С.Л. Лингвистическая модель для компьютерного анализа тональности публикаций СМИ
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005
Доклад освещает опыт практического решения задачи определения тональности текста по отношению к заданному объекту. Систематизируются средства, используемые автором текста для формирования тонально окрашенного образа объекта, и строится лингвистическая модель для выделения всех составляющих этого образа. Описывается схема оценки тональности “позитив/негатив” с учетом тех мест, которые занимают в составе пропозиций тональные и нейтральные слова, средства выражения отрицания и инверсии смысла.


Ермаков А.Е. Референция обозначений персон и организаций в русскоязычных текстах СМИ: эмпирические закономерности для компьютерного анализа
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005
Доклад посвящен проблемам установления кореферентности обозначений персон и организаций при компьютерном анализе текста. Рассматриваются особенности употребления таких обозначений в тексте СМИ и эмпирические закономерности, с опорой на которые на практике удается провести достаточно достоверный анализ кореферентности. Описывается схема принятия решения при определении референтов, реализованная в программных продукта RCO.


Ермаков А.Е. Значимость элементов текста в свете теории синтаксической парадигмы
Русский язык: исторические судьбы и современность. II Международный конгресс исследователей русского языка. Труды и материалы. - Москва, МГУ, 2004.
В докладе анонсируется формальная модель, которая позволяет численно оценить значимость элементов смысла текста с точки зрения его автора - коммуникативный ранг.


Ермаков А.Е. Эксплицирование элементов смысла текста средствами синтаксического анализа-синтеза
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2003. – Москва, Наука, 2003
В докладе предлагается метод построения информационного портрета документа на основе элементов смысла текста, извлекаемых средствами синтаксического анализа и синтеза. Метод основан на использовании синтаксического анализатора с последующим преобразованием семантической сети во множество строк, которые представляют в унифицированном виде все элементарные отношения между сущностями в тексте и являются корректными с точки зрения грамматики русского языка. Описывается ряд преобразований синтаксических структур, обеспечивающих инвариантность представления смыслов от ряда особенностей поверхностно-синтаксической организации текста. Предлагается способ ранжирования полученных элементов смысла по информативности с точки зрения характеристики текста в прикладных системах.


Ермаков А.Е., Плешко В.В. Компьютерная морфология в контексте анализа связного текста
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2004. – Москва, Наука, 2004
Доклад посвящен ключевым проблемам морфологического разбора слов в тексте на русском языке. Затронуты вопросы, связанные с анализом неизвестных слов, омонимией, выделением в тексте сложных объектов-словосочетаний, и показано, как использовать формальные особенности текста и контекст для повышения точности разбора. Изложены принципы построения морфоанализатора, способного генерировать гипотезы о словоизменении с учетом различных допущений, в том числе эффективное кодирование словаря, реализация быстрого поиска, алгоритмы анализа неизвестных слов на основе правил и по аналогии с другими словами. В заключение обсуждается словарь словоизменения.


Ермаков А.Е. Морфологический анализатор - основа поисковых систем
Компьютерные Вести, Минск, N 15, 2004
Эксклюзивное интервью, в котором рассказывается об истории создания морфологического анализатора RCO Morphology, а также затрагивается ряд сопутствующих вопросов, связанных с компьютерной лингвистикой и поисковыми системами.


Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах
Компьютерная лингвистика и интеллектуальные технологии: труды Международного семинара Диалог’2002. В двух томах. Т.2. “Прикладные проблемы”. – Москва, Наука, 2002.




Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru