RCO Zoom – Высокопроизводительная поисково-аналитическая система с функциями контент-анализа в реальном времени и транзакционного хранилища документов.
В современных условиях
увеличение интенсивности поступающих потоков информации и, как следствие,
накопление огромных архивов текстовых документов, требует применения новых
средств организации доступа к данным. В больших информационных базах для
ряда объектов возникает избыточность информации при попытках использования
традиционных инструментов (рубрикаторы, поисковые системы). Поэтому наибольшее предпочтение отдается системам, способным осуществлять
поиск и обработку информации в считанные секунды. Кроме того, главной потребностью пользователя является извлечение из
информации пользы в виде знаний и точных решений.
К основным задачам пользователя
относятся следующие:
- Сбор
информации об объектах (персонах, событиях, регионах, предприятиях,
оргструктурах, социумах и пр.)
- Определение свойств и функций с
привязкой ко времени и месту, выделение главного
- Определение основных тенденций
- Определение связей объектов
- Выделение аномалий
Одна из проблем качества
поиска заключается в сложности подбора ключевых слов для формулировки запроса.
Это может быть связано как с недостаточным владением терминологией исследуемой
предметной области, так и с наличием в языке многозначных и синонимичных слов.
Оперативность поиска
зависит как от навыков и опыта самого пользователя, так и от сложности решаемой
задачи.
Как отмечалось выше,
кроме указанной проблемы поиска, существует широкий круг аналитических задач, требующих выявления скрытых
взаимосвязей между объектами, определения ключевых факторов, влияющих на
развитие ситуации, в том числе, задачи прогнозирования тенденций развития
исследуемых процессов. Для таких задач необходима специализированная Система.
Система обладает уникальным инструментарием для проведения
эффективного поиска и аналитических исследований информации в кратчайшие сроки.
Система позволяет работать с огромными массивами текстовой информации в реальном
времени (объем базы – до сотен гигабайт, время поиска и обработки – секунды).
Средство отображения – информационный портрет дает возможность получить ключевые слова, формулировать и проверять гипотезы, разделять объекты, выделять статистические
инварианты в первом приближении.
При этом ситуация с информационной
избыточностью полностью меняется: чем больше информации, тем лучше.
Основные преимущества системы RCO Zoom
- Высокая скорость и гибкость загрузки и поиска информации
- Встроенные механизмы контент-анализа
- Высококачественная морфология (русский и английский языки)
- Поддержка работы с многостраничными документами
- Эффективная база данных документов
- Развитые средства администрирования
Высокая скорость загрузки, индексирования и поиска информации
- 64-х разрядный код обеспечивает высокую производительность
Поддержка разных форматов входных документов, распознавание языка и кодировки
- Прозрачная и инкрементная загрузка базы с определением дублей входных документов
- Возможность настройки параметров загрузки
- Специальные технологии работы с многостраничными документами обеспечивают возможность работы с большими – сотни и тысячи страниц документами без потери производительности
Встроенные механизмы контент-анализа
- Проведение контент-анализа в реальном масштабе времени
- Автоматическое выделение главных тем – тегов документов
- Определение тематически и текстуально похожих документов
- Решена проблема доминирования длинных документов
- Автоматическая классификация документов
- Автоматическая кластеризация документов
Морфология
- Морфологический модуль системы поддерживает русский и английский языки, легко может быть подключена поддержка других языков
- Морфологический модуль интегрирован с таблицами синонимов, соответствующими предметной области
Работа с открытой и конфиденциальной информацией
- Решена проблема достаточной производительности системы при работе в сетях, имеющих средства криптографирования и защиты
Эффективная база данных документов
- Система имеет механизмы поддержания транзакционной целостности, откатов БД
- Ведет архив исходных документов, в т.ч., сканкопий документов
- Поддерживает механизм версионности документов
- Обеспечивает функции бэкапа и восстановления БД
Администрирование
- Система имеет эффективные механизмы разграничения прав доступа на уровне БД, сегментов информации, отдельных документов
- Поддерживает также внешние механизмы разграничения доступа на уровне сегментов
- Имеет оболочку администратора системы, реестр параметров системы
Поддерживает Windows–аутентификацию
- Имеет средства удаленного администрирования
- Есть возможность ведения журнала работы пользователей, в т.ч. запросов, просмотра документов