Модуль RCO Address Parser производит разбор текстовой адресной строки, содержащей российский почтовый адрес, проверяет корректность адресной информации на основании эталонной базы КЛАДР, приводит все элементы адреса к стандартному написанию в установленном порядке, а также производит, при необходимости, исправление опечаток и восстановление пропущенных элементов адреса.
RCO Address Parser предоставляет программный интерфейс Oracle PL/SQL для ведения справочника адресов, а также интерактивную web-страницу для тестирования.
Для разбора адреса на элементы используется модуль выделения конструкций в тексте по шаблонам RCO Pattern Extractor (также доступный в составе RCO Fact Extractor SDK) с набором соответствующих правил, учитывающих различные способы написания/искажения российских почтовых адресов.
Для исправления опечаток и быстрого поиска по КЛАДР используются специальные индексы, разработанные RCO.
Основные виды ошибок/опечаток, устраняемых во входных данных:
Кроме того, возможны распознавание зарубежного адреса и вставка его в справочник без попыток найти похожий адрес на территории РФ.
Восстанавливаемая адресная информация:
- Почтовый индекс;
- Код КЛАДР;
Пропущенные элементы адреса (область, район и т.п.).
Для устранения неточностей, порой возникающих при разборе адреса, система генерирует множество гипотез и выбирает наилучшую.
Для возможного «ручного» анализа, помимо наилучшей гипотезы, отдельно сохраняются пять следующих наилучших гипотез-кандидатов и их оценки.
Для установки продукта необходима СУБД Oracle любой редакции.
Тип лицензии: 1 инсталляция.