|
Антонов А.В., Курзинер Е.С. Определение тематически значимых документов в системе Галактика-zoom (авторубрикация)
Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции "Диалог'2005"/ Под ред. И.М. Кобозевой, А.С. Нариньяни, В.П. Селегея. - М.:Наука, 2005
В статье описывается методика авторубрикации, используемая в поисково-аналитической системе "Галактика-Зум". Предварительно системой определяются информационные портреты, или ключевые темы, конкретных рубрик - по оригинальной технологии выделения и ранжирования ключевых тем. Затем автоматически происходит автоклассификация документов методом сравнения информационных портретов документа и заданных рубрик.
Ермаков А.Е., Киселев С.Л. Лингвистическая модель для компьютерного анализа тональности публикаций СМИ
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005
Доклад освещает опыт практического решения задачи определения тональности текста по отношению к заданному объекту. Систематизируются средства, используемые автором текста для формирования тонально окрашенного образа объекта, и строится лингвистическая модель для выделения всех составляющих этого образа. Описывается схема оценки тональности “позитив/негатив” с учетом тех мест, которые занимают в составе пропозиций тональные и нейтральные слова, средства выражения отрицания и инверсии смысла.
Ермаков А.Е. Референция обозначений персон и организаций в русскоязычных текстах СМИ: эмпирические закономерности для компьютерного анализа
Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2005. – Москва, Наука, 2005
Доклад посвящен проблемам установления кореферентности обозначений персон и организаций при компьютерном анализе текста. Рассматриваются особенности употребления таких обозначений в тексте СМИ и эмпирические закономерности, с опорой на которые на практике удается провести достаточно достоверный анализ кореферентности. Описывается схема принятия решения при определении референтов, реализованная в программных продукта RCO.
Ермаков А.Е. Поиск фактов в тексте
Мир ПК. – 2005. – N 2.
Популярная статья рассказывает о программе RCO Fact Extractor, которая предназначена для автоматического анализа текста и поиска фактов, связанных с заданными персонами и организациями.
Плешко В.В., Ермаков А.Е., Голенков В.П., Поляков П.Ю. RCO на РОМИП 2005
Российский семинар по Оценке Методов Информационного Поиска. Труды третьего российского семинара РОМИП’2005. (Ярославль, 6 октября 2005г.) – Санкт-Петербург: НИИ Химии СПбГУ, 2005, - 226 с.
Настоящая работа является отчетом об экспериментах, проведенных в рамках цикла семинара РОМИП 2005 года. Проведены исследования различных факторов, влияющих на качество алгоритмов тематической классификации. Также получены предварительные результаты по контекстно-зависимому аннотированию, выявлению наименований персон и организаций, поиску описаний фактов.
Ермаков А.Е., Плешко В.В. Компьютерный анализ текста при сборе информации к досье из открытых источников
Доклад на 3-ей конференции «Конкурентная разведка в металлургии» (19-20 января 2005 г., Москва, гостиница «Балчуг Кемпински»)
Доклад освещает проблемы, возникающие при ведении конкурентной разведки по документам СМИ, и рассказывает о программе RCO Fact Extractor, которая предназначена для автоматического анализа текста и поиска фактов, связанных с заданными персонами и организациями.
Плешко В.В., Ермаков А.Е., Голенков В.П. RCO на РОМИП 2004
Российский семинар по Оценке Методов Информационного Поиска. Труды второго российского семинара РОМИП’2004. (Пущино, 1 октября 2004г.) – Санкт-Петербург: НИИ Химии СПбГУ, 2004, - 214 с.
Настоящая работа является отчетом об экспериментах, проведенных в рамках инициативы РОМИП. В результате выполнения дорожек по поиску web-страниц и поиску правовых документов были получены численные оценки влияния учета словоформ и словосочетаний на показатели полноты и точности. Получены предварительные результаты для дорожек по классификации web-сайтов и классификации правовых документов. Приведено описание экспериментов по поиску биографических фактов, связанных с заданными персонами.
Ермаков А.Е. Значимость элементов текста в свете теории синтаксической парадигмы
Русский язык: исторические судьбы и современность. II Международный конгресс исследователей русского языка. Труды и материалы. - Москва, МГУ, 2004.
В докладе анонсируется формальная модель, которая позволяет численно оценить значимость элементов смысла текста с точки зрения его автора - коммуникативный ранг.
Плешко В.В., Ермаков А.Е., Митюнин В.А. RCO на РОМИП 2003: отчет об участии в семинаре по оценке методов информационного поиска
Труды первого российского семинара РОМИП’2003. – Санкт-Петербург: НИИ Химии СПбГУ, 2003
Настоящая работа является отчетом об экспериментах по поиску web-страниц и классификации web-сайтов, проведенных в рамках инициативы РОМИП. Главной целью работы была апробация методов оценки качества информационного поиска на русскоязычных текстовых корпусах.
Плешко В.В. Поиск с учетом словоформ русского языка
Oracle Magazine, Июнь/Июль 2003
В статье рассматриваются вопросы организации контекстного поиска в СУБД Oracle при помощи компоненты Oracle Text и продукта Russian Context Optimizer (RCO).
|