На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Продукты
Общий форум для всех продуктов

RCO Law Reference Extractor SDK











Расширения стандартных решений
RCO for Oracle: поиск на русском языке
RCO for BackOffice: поиск на русском языке



Инструментарий разработчика
RCO Fact Extractor SDK
RCO Text Categorization Engine
RCO Address Parser
RCO Database Record Cleaner
RCO Morphology SDK
RCO Morphology Professional SDK
RCO Information Extraction Service



Приложения RCO Fact Extractor SDK
RCO Deduplicator SDK
RCO TopExtractor SDK
RCO Glossary Maker SDK
RCO Block Parser SDK
RCO Law Reference Extractor SDK



Инструментарий аналитика
RCO Fact Extractor Desktop
RCO Zoom



Архив продуктов (более не поддерживаются)
RCO Syntactic Engine SDK
RCO Semantic Network SDK
RCO Pattern Extractor SDK
RCO Entity Extractor SDK




Форум

Денис

 07.03.06, 13:45
RCO for BackOffice: Ошибка IFilter.GetText() при извлечении текста из больших документов MSWord
Здравствуйте.

При попытке извлечения текста из большого документа MS Word (объем – 6 Мб, 206.670 символов) возникает ошибка:
System.Runtime.InteropServices.COMException (0x80010105): The server threw an exception at XGPFTIFILTERLib.GPFilterClass.GetText()…

Используется RCO for BackOffice, .NET и следующий код для получения текста документа:
object oBuff;
///получаем документ
...
StringBuilder sbRes = new StringBuilder();

gpfilter = new GPFilterClass();
gpfilter.Init(1, sFileType);///sFileType равен “.doc”
gpfilter.AddData(oBuff);
sbRes.Append(gpfilter.GetTitle() + " ");
sbRes.Append(gpfilter.GetText());

Из файлов меньшего объема (1.6 мб) текст извлекается без ошибок.
Подскажите, в чем может быть причина?
Ответить

Голенков Владимир

 07.03.06, 14:36
re: RCO for BackOffice: Ошибка IFilter.GetText() при извлечении текста из больших документов MSWord
здравствуйте, я делал эту компоненту

1. сначало надо вызывать GetText(), а потом GetTitle(), иначе вернет некорректное название

2. я проверил на 7Mb, отработало

3. есть ли ошибка при инициализаии через файл: .Init(0, sFilePath)?

4. можете мне выслать файл для теста? gvp(эт)metric.ru
Ответить

Денис

 07.03.06, 18:24
re: re: RCO for BackOffice: Ошибка IFilter.GetText() при извлечении текста из больших документов MSWord
1. Поменял местами, ошибка все равно есть.

3. При самой инициализации - ошибки нет, ошибка остается при обращении к методу GetText().

4. Выслал.
Ответить

Голенков Владимир

 09.03.06, 14:25
Исправлена компонента SDK XGPFTIFilter.dll
Соответствующие инсталяции RCO for BackOffice 2000 обновлены.
Ответить

Денис

 09.03.06, 14:58
re: Исправлена компонента SDK XGPFTIFilter.dll
Спасибо! Ошибка больше НЕ повторяется.
Ответить
Новое сообщение






Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru