Пакет для СУБД Oracle RCO Database Record Cleaner осуществляет разбор и нормализацию строковых полей баз данных (БД) для учетных и фактографических БД.
Из обрабатываемых полей извлекается и стандартизуется такая информация, как:
- ФИО;
- наименования организаций;
- различные идентификаторы (ИНН, ОГРН, ОГРНИП, ОКПО и т.д.);
- номера счетов;
- номера паспортов;
географические объекты.
После разбора данные могут быть сохранены в БД в очищенном и реструктурированном виде.
Основные функции пакета реализуются на базе модуля выделения конструкций в тексте по шаблонам RCO Pattern Extractor (также доступный в составе RCO Fact Extractor SDK). Настройки данного модуля включают в себя большой комплекс правил для разбора самых разнообразных способов написания перечисленных выше сущностей, обнаруженных аналитиками RCO в ходе работы с различными базами данных. В соответствии с особенностями записи информации в конкретной базе данных, поставляемые в составе пакета правила могут быть донастроены или расширены на новые типы сущностей.
Для установки продукта необходима СУБД Oracle любой редакции.
Тип лицензии: 1 инсталляция.