На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Продукты
RCO for BackOffice: поиск на русском языке

RCO for BackOffice: поиск на русском языке






Расширения стандартных решений

RCO for Oracle: поиск на русском языке

RCO for BackOffice: поиск на русском языке

Общая информация
Документация
Форум
Демо-версия
Цены







Инструментарий разработчика
RCO Fact Extractor SDK
RCO Text Categorization Engine
RCO Address Parser
RCO Database Record Cleaner
RCO Morphology SDK
RCO Morphology Professional SDK
RCO Information Extraction Service



Приложения RCO Fact Extractor SDK
RCO Deduplicator SDK
RCO TopExtractor SDK
RCO Glossary Maker SDK
RCO Block Parser SDK
RCO Law Reference Extractor SDK



Инструментарий аналитика
RCO Fact Extractor Desktop
RCO Zoom



Архив продуктов (более не поддерживаются)
RCO Syntactic Engine SDK
RCO Semantic Network SDK
RCO Pattern Extractor SDK
RCO Entity Extractor SDK




Общая информация

RCO for BackOffice позволяет осуществлять полнотекстовый поиск с учетом словоформ русского языка в следующих приложениях Microsoft (на 32- и 64-разрядных системах):

  • Windows® Indexing Service 3.0, Windows® Search,
  • Microsoft SharePoint™ Portal Server 2001-2007,
  • Microsoft SQL Server™ 2000-2008,
  • Microsoft Exchange Server 2000-2007.

Учет специфики языка позволяет при построении индекса корректно определять границы слов и использовать список стоп-слов, что повышает точность поиска, а также при поиске расширять слова запроса всеми словоформами для большей полноты результатов поиска.

Преимущества

 RCO for BackOffice помогает быстро найти требуемую информацию в корпоративных архивах.

В общих папках Exchange Server часто хранится информация о проектной деятельности компании в виде сообщений электронной почты и вложений в виде документов в различных форматах MS Office. После установки RCO for BackOffice сотрудники компании смогут посредством опции «Расширенный поиск» Microsoft Outlook эффективно искать нужную информацию и принимать решения, опираясь на опыт компании.

Использование SharePoint Portal Server совместно с RCO for BackOffice значительно повышает качество поиска в среде интранет. Никаких дополнительных настроек при этом не требуется – просто установите RCO и почувствуйте разницу.

 RCO for BackOffice повышает качество услуг, оказываемых потребителю.

Поиск по web-сайту вашей компании, по вашему интернет-магазину, работающий на основе Indexing Service или SQL Server, может быть значительно улучшен при помощи RCO for Backoffice. Посетитель вашего сайта быстрее найдет нужную информацию или товар.

 RCO for BackOffice дает конкурентные преимущества вашему программному продукту.

Если вы являетесь поставщиком решений в области организации электронных архивов или систем управления документооборотом на базе технологий Microsoft, добавление в ваше решение функциональности RCO поможет вам опередить конкурентов.

 RCO for BackOffice прост и удобен в лицензировании.

Лицензирование не по числу пользователей, а по числу процессоров на сервере. При этом различается всего три случая:

  • один процессор,
  • два и более процессоров,
  • кластер.

Технические подробности

Практически все серверные приложения MS BackOffice используют технологию Microsoft full-text Search для организации полнотекстового поиска по массивам документов.

Ключевыми моментами данной технологии являются:

  • работа с различными типами хранилищ документов,
  • работа с различными форматами документов,
  • поддержание поискового индекса для быстрого выполнения запросов,
  • ранжирование списков найденных документов по релевантности,
  • учет специфики языка при выполнении поисковых запросов.

RCO for BackOffice добавляет в систему компоненты, отвечающие за учет морфологии русского языка при построении индексов и обработке поисковых запросов. Стыковка компонентов с системой является «бесшовной» – компоненты поддержки русского языка выполнены в соответствии со спецификациями Microsoft и работают наравне с другими языковыми компонентами, входящими в стандартную поставку Microsoft Windows.

Таким образом, поиск с учетом словоформ русского языка может осуществляться с использованием всех преимуществ Microsoft full-text Search, а именно:

  • множество форматов (все форматы MS Office, PDF, HTML, XML),
  • множество типов хранилищ (web-сайты, каталоги файловой системы, таблицы баз данных, папки MS Exchange),
  • возможность подключения новых форматов и новых типов хранилищ.

Более подробную информацию о технологии Microsoft full-text Search можно найти на сайте Microsoft по адресу http://www.microsoft.com/sharepoint/techinfo/planning/fullsearch.asp.

RCO состоит из четырех компонентов:

  • компонент морфологического анализа,
  • компонент разбора текста,
  • словарь стоп-слов,
  • компонент расширения MS SQL Full-Text Indexing Wizard.

Компонент морфологического анализа осуществляет как словарный, так и бессловарный анализ слов русского языка. Морфологический словарь RCO включает более 110 тысяч слов русского языка, что соответствует 2,5 миллионам различных словоформ. Алгоритмы бессловарного анализа позволяют с высокой степенью точности распознавать слова русского языка, не вошедшие в словарь.

Скорость работы модуля морфологического анализа в режиме расширения слов запроса всеми словоформами на машине с ЦП 1,3 ГГц составляет около 17 тысяч слов в секунду, чего достаточно для любой прикладной задачи.

Для настройки на заданную предметную область можно отдельно приобрести пакет актуализации морфологического словаря. В пакет входят исходные тексты словаря, утилита сборки и верификации, а также приложения, автоматизирующие процесс пополнения словаря.

Компонент разбора текста используется в процессе построения индекса и служит для определения границ слов, предложений и параграфов в тексте. При этом учитываются переносы и вариации написания слов с использованием дефиса.

Редактирование списка стоп-слов осуществляется при помощи MS Word или другого текстового процессора со встроенной поддержкой Unicode. Стоп-слова не включаются в индекс, и поиск по ним не производится. При редактировании возможно как добавление новых стоп-слов, так и удаление из списка тех, что являются значимыми для заданной предметной области.

Специально для SQL Server, где администрирование полнотекстовых индексов может производиться через пользовательский интерфейс консоли управления Enterprise Manager, RCO добавляет русский язык в список доступных языков в мастере Full-Text Indexing Wizard. Администратор теперь может управлять полнотекстовыми каталогами без привлечения Transact SQL.

Инсталлятор RCO представляет собой пакет Microsoft Installer с модулями Merge Module для каждого из ключевых компонентов продукта. Это значительно облегчает встраивание RCO в программное обеспечение сторонних производителей и позволяет избежать конфликтов при установке нескольких продуктов, использующих отдельные компоненты RCO.



Документация
Форум
Демо-версия
Цены



Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru