RCO - Публикации

О компании

Продукты

Технологии

Публикации

Партнерам

in English:

Компьютерная лингвистика

История

RCO на РОМИП

Информационный поиск

В общей сложности разработчиками направления RCO опубликовано около 50 печатных работ в области компьютерной лингвистики и искусственного интеллекта. В этом разделе сайте приведены наиболее интересные публикации, которые освещают ключевые аспекты технологий RCO и представляют основные вехи в истории развития направления.

Общий список статей и докладов, перечисленных в порядке их выхода в свет, доступен ниже на этой странице. Посредством меню в левой части экрана можно получить доступ к этим же публикациям, для удобства сгруппированным по разделам.

Раздел “Прикладные задачи” содержит статьи, посвященные конечным программным продуктам и практическим приложениям технологий анализа текста, различным аспектам построения информационно-поисковых и аналитических систем.

К разделу “Компьютерная лингвистика” отнесены те статьи, которые описывают алгоритмы и лингвистическое обеспечение, используемое для анализа текста на русском языке.

В раздел “История” вынесены статьи, материал которых в настоящее время мало актуален: описанные решения не используются в продуктах RCO, заменены более эффективными или претерпели значительную эволюцию. В первую очередь это относится к математическим и нейросетевым моделям, имеющим аналогию с обработкой информации правым полушарием мозга, на смену которому теперь пришли точные лингвистические методы анализа текста.

Фролов А.В., Поляков П.Ю., Плешко В.В. Использование семантических категорий в задаче классификации отзывов о книгах
Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной Международной конференции "Диалог". (Бекасово, 29 мая - 2 июня 2013 г.) Вып.12 (19): в 2 т. – Москва, Изд-во РГГУ, 2013
В данной работе исследуется метод использования семантических категорий фактов в качестве классификационных признаков для решения задач классификации отзывов о книгах на 2 (положительный, отрицательный) и 3 (положительный, отрицательный и нейтральный) класса. Кроме того, проанализированы основные ошибки и подводные камни, которые могут встречасться в задачах подобного рода.

Поляков П.Ю., Калинина М.В, Плешко В.В. Исследование применимости методов тематической классификации в задаче классификации отзывов о книгах
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции "Диалог-2012". – Москва, Изд-во РГГУ, 2012
В данной работе исследуются различные способы формирования обучающей выборки, методов извлечения классификационных признаков, а также методов построения классификаторов для решения задач классификации отзывов о книгах на 2 (положительный, отрицательный) и 3 (положительный, отрицательный и нейтральный) класса. Показано, что хороший результат можно получить путем применения к рассматриваемым задачам методов тематической классификации. Достигнутые показатели не уступают наилучшим результатам классификации веб-сайтов и нормативно-правовых документов, полученным участниками семинара РОМИП.

Ермаков А.Е. Извлечение знаний из текста и их обработка: состояние и перспективы
Информационные технологии, 2009, № 7.
Статья посвящена анализу достижений в области компьютерной обработки знаний, содержащихся в текстах на естественном языке. Формулируются актуальные направления прикладных исследований, связанные с извлечением и обработкой знаний в текстах Интернета. Описывается экспериментальная система для оценки потребительских свойств товаров на основании анализа отзывов их потребителей, размещенных в социальной сети Интернета.

Ермаков А.Е., Плешко В.В. Семантическая интерпретация в системах компьютерного анализа текста
Информационные технологии. - 2009. – N 6.
В статье описывается подход к построению семантического компонента в системах компьютерного анализа текста на естественном языке. Подход основан на применении специальных шаблонов к сети синтактико-семантических отношений между словами текста, которая строится синтаксическим анализатором. Шаблоны определяют способ интерпретации фрагментов сети в заданные фреймы, с идентификацией участников ситуаций и их ролей.

Ермаков А.Е., Плешко В.В. Обработка естественно-языковых запросов к поисковой машине на основе их лингвистического анализа
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2009. – Москва, Наука, 2009
Описывается новый способ преобразования запросов на естественном языке в языки запросов поисковых машин, основанный на машинном анализе синтаксических связей между словами и их отображении на соответствующие операторы языка поисковой машины с максимальным сохранением смысла исходного запроса.

Поляков П.Ю., Плешко В.В., Ермаков А.Е. RCO на РОМИП 2009
Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП’2009. (Петрозаводск, 16 сентября 2009г.) – Санкт-Петербург: НУ ЦСИ, 2009
Настоящая работа является отчетом об экспериментах, проведенных в рамках семинара РОМИП 2009 года. Проведены исследования влияния метода рубрикации в задаче классификации web-страниц и сайтов. Также апробирован новый метод преобразования поисковых запросов на коллекции нормативно-правовых документов.

Ермаков А.Е. Автоматизация онтологического инжиниринга в системах извлечения знаний из текста
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2008. – Москва, Наука, 2008
Доклад посвящен вопросам использования онтологий в системах извлечения знаний из текста. Рассматриваются особенности онтологий, используемых в таких системах. Предлагается методика автоматизированного построения онтологии, когда термины предметной области и связи между ними первоначально выделяются при помощи методов компьютерного анализа текста.

Поляков П.Ю., Плешко В.В. RCO на РОМИП 2008
Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП’2007-2008. (Дубна, 9 октября 2008г.) – Санкт-Петербург: НУ ЦСИ, 2008
Настоящая работа является отчетом об экспериментах, проведенных в рамках семинара РОМИП 2007-2008 годов. Проведены исследования влияния способа отбора терминов в задаче классификации web-страниц и сайтов. Также были проведены эксперименты по кластеризации новостей.

А.Е. Ермаков Автоматическое извлечение фактов из текстов досье: опыт установления анафорических связей
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2007. – Москва, Наука, 2007
Доклад описывает опыт решения задачи автоматического извлечения фактов из текстовых документов особого стиля - досье. Описываются использованные для поиска фактов средства на основе синтаксического анализатора и синтактико-семантических шаблонов. Особое внимание уделяется закономерностям организации дискурса, использованным для установления анафорических связей.

Поляков П.Ю., Плешко В.В. RCO на РОМИП 2006
Российский семинар по Оценке Методов Информационного Поиска. Труды четвертого российского семинара РОМИП’2006. (Суздаль, 19 октября 2006г.) – Санкт-Петербург: НУ ЦСИ, 2006
Настоящая работа является отчетом об экспериментах, проведенных авторами в рамках цикла семинара РОМИП 2006 года. Проведены исследования различных факторов, влияющих на качество тематической классификации методом опорных векторов. Исследованы различные типы ядра, а также способы отбора классификационных признаков и их взвешивания.

[1] [2] [3] [4] [5]

вверх

Контакты

тел./факс: +7 495 287-9887

e-mail: info@rco.ru