На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Публикации

Публикации

























В общей сложности разработчиками направления RCO опубликовано около 50 печатных работ в области компьютерной лингвистики и искусственного интеллекта. В этом разделе сайте приведены наиболее интересные публикации, которые освещают ключевые аспекты технологий RCO и представляют основные вехи в истории развития направления.

Общий список статей и докладов, перечисленных в порядке их выхода в свет, доступен ниже на этой странице. Посредством меню в левой части экрана можно получить доступ к этим же публикациям, для удобства сгруппированным по разделам.

Раздел “Прикладные задачи” содержит статьи, посвященные конечным программным продуктам и практическим приложениям технологий анализа текста, различным аспектам построения информационно-поисковых и аналитических систем.

К разделу “Компьютерная лингвистика” отнесены те статьи, которые описывают алгоритмы и лингвистическое обеспечение, используемое для анализа текста на русском языке.

В раздел “История” вынесены статьи, материал которых в настоящее время мало актуален: описанные решения не используются в продуктах RCO, заменены более эффективными или претерпели значительную эволюцию. В первую очередь это относится к математическим и нейросетевым моделям, имеющим аналогию с обработкой информации правым полушарием мозга, на смену которому теперь пришли точные лингвистические методы анализа текста.



Ермаков А.Е. Эксплицирование элементов смысла текста средствами синтаксического анализа-синтеза
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2003. – Москва, Наука, 2003
В докладе предлагается метод построения информационного портрета документа на основе элементов смысла текста, извлекаемых средствами синтаксического анализа и синтеза. Метод основан на использовании синтаксического анализатора с последующим преобразованием семантической сети во множество строк, которые представляют в унифицированном виде все элементарные отношения между сущностями в тексте и являются корректными с точки зрения грамматики русского языка. Описывается ряд преобразований синтаксических структур, обеспечивающих инвариантность представления смыслов от ряда особенностей поверхностно-синтаксической организации текста. Предлагается способ ранжирования полученных элементов смысла по информативности с точки зрения характеристики текста в прикладных системах.


Ермаков А.Е., Плешко В.В. Компьютерная морфология в контексте анализа связного текста
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2004. – Москва, Наука, 2004
Доклад посвящен ключевым проблемам морфологического разбора слов в тексте на русском языке. Затронуты вопросы, связанные с анализом неизвестных слов, омонимией, выделением в тексте сложных объектов-словосочетаний, и показано, как использовать формальные особенности текста и контекст для повышения точности разбора. Изложены принципы построения морфоанализатора, способного генерировать гипотезы о словоизменении с учетом различных допущений, в том числе эффективное кодирование словаря, реализация быстрого поиска, алгоритмы анализа неизвестных слов на основе правил и по аналогии с другими словами. В заключение обсуждается словарь словоизменения.


Ермаков А.Е. Морфологический анализатор - основа поисковых систем
Компьютерные Вести, Минск, N 15, 2004
Эксклюзивное интервью, в котором рассказывается об истории создания морфологического анализатора RCO Morphology, а также затрагивается ряд сопутствующих вопросов, связанных с компьютерной лингвистикой и поисковыми системами.


Ермаков А.Е., Плешко В.В., Митюнин В.А. RCO Pattern Extractor: компонент выделения особых объектов в тексте
Информатизация и информационная безопасность правоохранительных органов: XI Международная научная конференция. Сборник трудов - Москва, 2003


Ермаков А.Е., Плешко В.В. Средства информационного поиска и навигации в интернет: опыт развития языковых технологий
Русский язык в интернете. Сб. статей. – Казань, Отечество, 2003
Большая обзорная статья, выход которой задержался на два года по вине издательства, в связи с чем материал несколько устарел и уже не отражает актуального состояния разработок на 2003 год. Тем не менее, статья имеет историческое значение, так как содержит в себе всю математику вместе с описанием ее приложений, разработанную нами в рамках ассоциативно-статистического подхода к анализу текста.


Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах
Компьютерная лингвистика и интеллектуальные технологии: труды Международного семинара Диалог’2002. В двух томах. Т.2. “Прикладные проблемы”. – Москва, Наука, 2002.


Ермаков А.Е., Плешко В.В. Синтаксический разбор в системах статистического анализа текста
Информационные технологии. - 2002. – N 7.
В статье рассмотрено место алгоритмов синтаксического разбора в прикладных системах компьютерного анализа полнотекстовых документов. На опыте собственных разработок показано, как применение подобных алгоритмов способно повысить качество статистических методов анализа текста при решении таких задач, как: формирование информационного портрета документа, выявление смысловых связей, автоматическое реферирование.


Антонов А. В., Курзинер Е. С. Автоматическое определение тематики большого необработанного текстового массива
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции "Диалог-2002"
Данная работа посвящена обсуждению результатов исследования художественных произведений Гоголя, Толстого, Достоевского, Чехова, Булгакова, ставившему задачей выяснение авторства на основании анализа лексического состава и стилистических особенностей текстов.


Ермаков А.Е., Плешко В.В. Семантическая сеть текста в задачах аналитика
Информатизация и информационная безопасность правоохранительных органов: XI Международная научная конференция. Сборник трудов - Москва, 2002.


Плешко В.В., Ермаков А.Е., Липинский Г.В. TopSOM: визуализация информационных массивов с применением самоорганизующихся тематических карт
Информационные технологии. - 2001. - N 8.

« предыдущая 

[1] [2] [3] [4] [5]  следующая »




Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru