На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Продукты
RCO Zoom

RCO Zoom






Инструментарий аналитика

RCO Fact Extractor Desktop

RCO Zoom

Общая информация
Документация
Форум







Расширения стандартных решений
RCO for Oracle: поиск на русском языке
RCO for BackOffice: поиск на русском языке



Инструментарий разработчика
RCO Fact Extractor SDK
RCO Text Categorization Engine
RCO Address Parser
RCO Database Record Cleaner
RCO Morphology SDK
RCO Morphology Professional SDK
RCO Information Extraction Service



Приложения RCO Fact Extractor SDK
RCO Deduplicator SDK
RCO TopExtractor SDK
RCO Glossary Maker SDK
RCO Block Parser SDK
RCO Law Reference Extractor SDK



Архив продуктов (более не поддерживаются)
RCO Syntactic Engine SDK
RCO Semantic Network SDK
RCO Pattern Extractor SDK
RCO Entity Extractor SDK




Общая информация

RCO Zoom – Высокопроизводительная поисково-аналитическая система с функциями контент-анализа в реальном времени и транзакционного хранилища документов.

В современных условиях увеличение интенсивности поступающих потоков информации и, как следствие, накопление огромных архивов текстовых документов, требует применения новых средств организации доступа к данным. В больших информационных базах для ряда объектов возникает избыточность информации при попытках использования традиционных инструментов (рубрикаторы, поисковые системы). Поэтому наибольшее предпочтение отдается системам, способным осуществлять поиск и обработку информации в считанные секунды. Кроме того, главной потребностью пользователя является извлечение из информации пользы в виде знаний и точных решений.

К основным задачам пользователя относятся следующие:

  1. Сбор информации об объектах (персонах, событиях, регионах, предприятиях, оргструктурах, социумах и пр.)
  2. Определение свойств и функций с привязкой ко времени и месту, выделение главного
  3. Определение основных тенденций
  4. Определение связей объектов
  5. Выделение аномалий

Одна из проблем качества поиска заключается в сложности подбора ключевых слов для формулировки запроса. Это может быть связано как с недостаточным владением терминологией исследуемой предметной области, так и с наличием в языке многозначных и синонимичных слов.

Оперативность поиска зависит как от навыков и опыта самого пользователя, так и от сложности решаемой задачи.

Как отмечалось выше, кроме указанной проблемы поиска, существует широкий круг аналитических задач, требующих выявления скрытых взаимосвязей между объектами, определения ключевых факторов, влияющих на развитие ситуации, в том числе, задачи прогнозирования тенденций развития исследуемых процессов. Для таких задач необходима специализированная Система.

Система обладает уникальным инструментарием для проведения эффективного поиска и аналитических исследований информации в кратчайшие сроки.

Система позволяет работать с огромными массивами текстовой информации в реальном времени (объем базы – до сотен гигабайт, время поиска и обработки – секунды).

Средство отображения – информационный портрет дает возможность получить ключевые слова, формулировать и проверять гипотезы, разделять объекты, выделять статистические инварианты в первом приближении.

При этом ситуация с информационной избыточностью полностью меняется: чем больше информации, тем лучше.

 Основные преимущества системы RCO Zoom

  • Высокая скорость и гибкость загрузки и поиска информации
  • Встроенные механизмы контент-анализа
  • Высококачественная морфология (русский и английский языки)
  • Поддержка работы с многостраничными документами
  • Эффективная база данных документов
  • Развитые средства администрирования

 Высокая скорость загрузки, индексирования и поиска информации

  • 64-х разрядный код обеспечивает высокую производительность Поддержка разных форматов входных документов, распознавание языка и кодировки
  • Прозрачная и инкрементная загрузка базы с определением дублей входных документов
  • Возможность настройки параметров загрузки
  • Специальные технологии работы с многостраничными документами обеспечивают возможность работы с большими – сотни и тысячи страниц документами без потери производительности

 Встроенные механизмы контент-анализа

  • Проведение контент-анализа в реальном масштабе времени
  • Автоматическое выделение главных тем – тегов документов
  • Определение тематически и текстуально похожих документов
  • Решена проблема доминирования длинных документов
  • Автоматическая классификация документов
  • Автоматическая кластеризация документов

 Морфология

  • Морфологический модуль системы поддерживает русский и английский языки, легко может быть подключена поддержка других языков
  • Морфологический модуль интегрирован с таблицами синонимов, соответствующими предметной области

 Работа с открытой и конфиденциальной информацией

  • Решена проблема достаточной производительности системы при работе в сетях, имеющих средства криптографирования и защиты

 Эффективная база данных документов

  • Система имеет механизмы поддержания транзакционной целостности, откатов БД
  • Ведет архив исходных документов, в т.ч., сканкопий документов
  • Поддерживает механизм версионности документов
  • Обеспечивает функции бэкапа и восстановления БД

 Администрирование

  • Система имеет эффективные механизмы разграничения прав доступа на уровне БД, сегментов информации, отдельных документов
  • Поддерживает также внешние механизмы разграничения доступа на уровне сегментов
  • Имеет оболочку администратора системы, реестр параметров системы Поддерживает Windows–аутентификацию
  • Имеет средства удаленного администрирования
  • Есть возможность ведения журнала работы пользователей, в т.ч. запросов, просмотра документов


Документация
Форум



Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru