|
Серия продуктов, выпускаемых под маркой RCOТМ, предназначена для поддержки широкого класса систем, использующих средства поиска и анализа текстовой информации, таких, как информационно-поисковые и аналитические системы, электронные архивы и системы управления документооборотом.
Продукты серии RCO задействуют передовые технологии обработки текста, лингвистические и математические алгоритмы, которые могут быть использованы для решения широкого класса задач: от контекстного поиска документов с учетом всех словоформ, синонимов и опечаток до создания систем поддержки принятия экспертных решений на основе анализа информационных массивов.
Инструментарий разработчика
|
RCO Fact Extractor SDK
Комплексный инструмент для разработки информационно-поисковых и аналитических систем, требующих лингвистического анализа текста на русском языке.
Ядро пакета представляет библиотека RCO FX Ru, которая осуществляет полный синтактико-семантический разбор русского текста.
В состав пакета входят исходные коды приложений на С++, иллюстрирующие использование библиотеки RCO FX Ru для решения всех типовых задач, встающих перед разработчиками прикладных информационных систем.
|
|
RCO Text Categorization Engine
Библиотека для разработчика информационно-поисковых систем. Обеспечивает определение принадлежности текста к заданному множеству категорий, сбор статистики вхождения и сведений о позиции терминов из лексических профилей в тексте.
Поставляется в виде динамической библиотеки (dll) для Windows.
|
|
RCO Address Parser
Модуль RCO Address Parser производит разбор текстовой адресной строки, содержащей российский почтовый адрес, проверяет корректность адресной информации на основании эталонной базы КЛАДР, приводит все элементы адреса к стандартному написанию в установленном порядке, а также производит, при необходимости, исправление опечаток и восстановление пропущенных элементов адреса.
|
|
RCO Database Record Cleaner
Пакет для СУБД Oracle RCO Database Record Cleaner осуществляет разбор и нормализацию строковых полей баз данных (БД) для учетных и фактографических БД.
|
|
RCO Morphology SDK
Библиотека для разработчика информационно-поисковых систем. Обеспечивает получение нормальной формы и всех грамматических форм любого слова русского языка.
Поставляется в виде динамической библиотеки (dll) для Windows.
|
|
RCO Morphology Professional SDK
Библиотека позволяет включить русскую морфологию в системы автоматического анализа текста и информационного поиска. Продукт поддерживает все возможности грамматического анализа любого слова русского языка: определение грамматических характеристик слова, приведение к нормальной форме, получение требуемых словоформ.
Поставляется в виде динамической библиотеки (dll) для Windows.
|
|
RCO Information Extraction Service
Служба RCO Information Extraction Service предназначена для решения задач, связанных с анализом неструктурированной и полуструктурированной информации, часто возникающих при построении фактографических и полнотекстовых баз данных.
Служба предоставляет единую среду для подключения различных модулей разбора текста в процессе обработки и анализа данных. Архитектура службы обеспечивает масштабируемость и устойчивость создаваемых компонентов: запуск нескольких экземпляров службы на одном сервере, автоматический перезапуск в случае аварийного останова модуля разбора и при превышении максимально допустимого времени обработки текста.
|
Инструментарий аналитика
|
RCO Fact Extractor Desktop
RCO Fact Extractor Desktop – это персональное приложение для Windows, которое предназначено для аналитической обработки текста на русском языке и выявления фактов различного типа, связанных с заданными объектами – персонами и организациями. Основная сфера применения программы – это задачи из области компьютерной разведки, требующие высокоточного поиска информации, например, автоматический подбор материала к досье на целевой объект или же мониторинг определенных сторон его активности, освещаемых в СМИ. Программа позволяет не только найти фрагменты текста, в которых говорилось, например, о поездках персоны, ее встречах, заключении договоров, сделках купли-продажи, но и точно определить все места поездок, визави и контрагентов, наименование товаров и прочее.
|
|
RCO Zoom
Высокопроизводительная поисково-аналитическая система с функциями контент-анализа в реальном времени и транзакционного хранилища документов.
|
Расширения стандартных решений
|
RCO for Oracle: поиск на русском языке
RCO for Oracle ‑ единственный на рынке продукт, позволяющий значительно расширить возможности OracleText при работе c базами данных, содержащими документы на русском языке. Продукт предназначается для системных интеграторов и разработчиков приложений, использующих возможности информационного поиска, а также отделов автоматизации производства среднего и крупного бизнеса. RCO for Oracle задействует такие технологии, как лексико-грамматический и статистический анализ текста, алгоритмы автоматической классификации, рубрицирования и реферирования; нечеткого поиска, реализуя все существующие возможности OracleText для русского языка.
Существуют версии продукта для Windows и различных UNIX платформ (SUN Solaris, SCO UnixWare, Compaq Tru64 Unix, HP UX, IBM AIX).
|
|
RCO for BackOffice: поиск на русском языке
Продукт позволяет расширить возможности Microsoft BackOffice (MS SharePoint Portal, MS Indexing Service, MS Exchange Server и MS SQL Server) при работе с документами на русском языке, обеспечивая поиск с учетом всех грамматических форм слов на основе морфологического анализа.
|
Приложения RCO Fact Extractor SDK
|
RCO Deduplicator SDK
Пакет для разработки программного обеспечения RCO Deduplicator SDK предназначен для решения задачи поиска информационных дублей загружаемого документа среди документов, имеющихся в базе.
|
|
RCO TopExtractor SDK
Пакет для разработки программного обеспечения RCO TopExtractor SDK презназначен для решения задачи построения информационного портрета анализируемого текста в виде набора наиболее значимых терминов, общего реферата, рефератов по каждому термину, карты ассоциативных связей между терминами.
|
|
RCO Glossary Maker SDK
Модуль предназначен для генерации словарей терминов по коллекции текстов. Области применения: дополнительное средство навигации по массиву документов, уточнения поискового запроса, а также составление словаря предметной области.
|
|
RCO Block Parser SDK
В пакете реализована функция автоматической идентификации типов входных документов на основании множества шаблонов, описывающих структуры документов на специальном языке.
|
|
RCO Law Reference Extractor SDK
Пакет предназначен для выявления упоминаний нормативно-правовых актов в анализируемом тексте. Это дает возможность устанавливать гипертекстовые ссылки как на нормативно-правовые акты, хранящиеся в справочно-правовых системах, так и на внутренние документы (приказы, распоряжения) организации.
|
Архив продуктов (более не поддерживаются)
|
RCO Syntactic Engine SDK
Продукт позволяет включить возможности синтактико-семантического анализа русского текста в интеллектуальные информационные системы, требующие работы со смыслом документа. RCO Syntactic Engine позволяет решать задачи, требующие выявления скрытых взаимосвязей между целевыми объектами (персоналиями, организациями, событиями) и семантической классификации отношений между ними на основе автоматического анализа текста.
Продукт поставляется в виде динамической библиотеки (dll) для Windows.
|
|
RCO Semantic Network SDK
Продукт предназначен для разработчиков информационно-поисковых и аналитических систем и позволяет выявить ключевые понятия документа, в том числе наименования персон и организаций, с ассоциативными связями между ними на основе грамматического и статистического анализа текста, а также получить несколько видов рефератов документа. Область применения RCO Semantic Network охватывает задачи построения информационного портрета документа, тематического индексирования полнотекстовых баз данных, сбора информации о целевых объектах (персонах и организациях).
Продукт поставляется в виде динамической библиотеки (dll) для Windows и разделяемой библиотеки (shared library) для Linux.
|
|
RCO Pattern Extractor SDK
Продукт предназначен для анализа текста и распознавания в нем различных объектов в соответствии с образцами, заданными на формальном языке. Область применения RCO Pattern Extractor в первую очередь включает в себя выделение специальных конструкций, отличающихся особого вида написанием, – различных наименований, адресов, номеров и т.п.
Продукт поставляется в виде динамической библиотеки (dll) для Windows.
|
|
RCO Entity Extractor SDK
Библиотека предназначена для анализа русского текста и выделения различных сущностей, упомянутых в нем, прежде всего именованных персон, организаций и географических объектов.
Библиотека также включает в себя все возможности продукта RCO Pattern Extractor SDK для выделения особых конструкций (дат, денежных сумм, адресов и проч.)
Поставляется в виде динамической библиотеки (dll) для Windows.
|
|
|