Библиотека RCO Morphology SDK предназначена для морфологического анализа слов русского языка в информационно-поисковых системах и позволяет решать следующие задачи:
-
получать нормальную форму слова, заданного в любой грамматической форме;
-
получать все грамматические формы слова, заданного в любой грамматической форме.
Библиотека включает в себя:
-
точный анализ известных слов по словарю объемом более 115 тысяч слов, что покрывает более 3-х миллионов словоформ;
-
высоко достоверный анализ неизвестного слова на основе комплекса правил словообразования и словоизменения;
-
вероятностный анализ посредством соотнесения с моделями словоизменения часто встречающихся слов на основе оценки флективной и суффиксальной частей слова.
Объем бинарного словаря - 3 МБайта.
Скорость морфологического анализа – более 100 тысяч слов в секунду (Процессор AMD Athlon, 1000 МГц).
Продукт поставляется в виде динамической библиотеки (dll) для Windows.
Специфика предметной области, в которой работают приложения информационного поиска, может потребовать пополнения словаря новой лексикой. С этой целью библиотека комплектуется средствами автоматизированного пополнения и сборки словаря.