|
Ермаков А.Е. Эксплицирование элементов смысла текста средствами синтаксического анализа-синтеза
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2003. – Москва, Наука, 2003
В докладе предлагается метод построения информационного портрета документа на основе элементов смысла текста, извлекаемых средствами синтаксического анализа и синтеза. Метод основан на использовании синтаксического анализатора с последующим преобразованием семантической сети во множество строк, которые представляют в унифицированном виде все элементарные отношения между сущностями в тексте и являются корректными с точки зрения грамматики русского языка. Описывается ряд преобразований синтаксических структур, обеспечивающих инвариантность представления смыслов от ряда особенностей поверхностно-синтаксической организации текста. Предлагается способ ранжирования полученных элементов смысла по информативности с точки зрения характеристики текста в прикладных системах.
Ермаков А.Е., Плешко В.В. Компьютерная морфология в контексте анализа связного текста
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2004. – Москва, Наука, 2004
Доклад посвящен ключевым проблемам морфологического разбора слов в тексте на русском языке. Затронуты вопросы, связанные с анализом неизвестных слов, омонимией, выделением в тексте сложных объектов-словосочетаний, и показано, как использовать формальные особенности текста и контекст для повышения точности разбора. Изложены принципы построения морфоанализатора, способного генерировать гипотезы о словоизменении с учетом различных допущений, в том числе эффективное кодирование словаря, реализация быстрого поиска, алгоритмы анализа неизвестных слов на основе правил и по аналогии с другими словами. В заключение обсуждается словарь словоизменения.
Ермаков А.Е. Морфологический анализатор - основа поисковых систем
Компьютерные Вести, Минск, N 15, 2004
Эксклюзивное интервью, в котором рассказывается об истории создания морфологического анализатора RCO Morphology, а также затрагивается ряд сопутствующих вопросов, связанных с компьютерной лингвистикой и поисковыми системами.
Ермаков А.Е., Плешко В.В., Митюнин В.А. RCO Pattern Extractor: компонент выделения особых объектов в тексте
Информатизация и информационная безопасность правоохранительных органов: XI Международная научная конференция. Сборник трудов - Москва, 2003
Ермаков А.Е., Плешко В.В. Средства информационного поиска и навигации в интернет: опыт развития языковых технологий
Русский язык в интернете. Сб. статей. – Казань, Отечество, 2003
Большая обзорная статья, выход которой задержался на два года по вине издательства, в связи с чем материал несколько устарел и уже не отражает актуального состояния разработок на 2003 год. Тем не менее, статья имеет историческое значение, так как содержит в себе всю математику вместе с описанием ее приложений, разработанную нами в рамках ассоциативно-статистического подхода к анализу текста.
Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах
Компьютерная лингвистика и интеллектуальные технологии: труды Международного семинара Диалог’2002. В двух томах. Т.2. “Прикладные проблемы”. – Москва, Наука, 2002.
Ермаков А.Е., Плешко В.В. Синтаксический разбор в системах статистического анализа текста
Информационные технологии. - 2002. – N 7.
В статье рассмотрено место алгоритмов синтаксического разбора в прикладных системах компьютерного анализа полнотекстовых документов. На опыте собственных разработок показано, как применение подобных алгоритмов способно повысить качество статистических методов анализа текста при решении таких задач, как: формирование информационного портрета документа, выявление смысловых связей, автоматическое реферирование.
Антонов А. В., Курзинер Е. С. Автоматическое определение тематики большого необработанного текстового массива
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции "Диалог-2002"
Данная работа посвящена обсуждению результатов исследования художественных произведений Гоголя, Толстого, Достоевского, Чехова, Булгакова, ставившему задачей выяснение авторства на основании анализа лексического состава и стилистических особенностей текстов.
Ермаков А.Е., Плешко В.В. Семантическая сеть текста в задачах аналитика
Информатизация и информационная безопасность правоохранительных органов: XI Международная научная конференция. Сборник трудов - Москва, 2002.
Плешко В.В., Ермаков А.Е., Липинский Г.В. TopSOM: визуализация информационных массивов с применением самоорганизующихся тематических карт
Информационные технологии. - 2001. - N 8.
|