На главную О компании Продукты Технологии Публикации Партнерам in English: in English
На главную

   Помощь
Главная
Продукты
Общий форум для всех продуктов

RCO Law Reference Extractor SDK











Расширения стандартных решений
RCO for Oracle: поиск на русском языке
RCO for BackOffice: поиск на русском языке



Инструментарий разработчика
RCO Fact Extractor SDK
RCO Text Categorization Engine
RCO Address Parser
RCO Database Record Cleaner
RCO Morphology SDK
RCO Morphology Professional SDK
RCO Information Extraction Service



Приложения RCO Fact Extractor SDK
RCO Deduplicator SDK
RCO TopExtractor SDK
RCO Glossary Maker SDK
RCO Block Parser SDK
RCO Law Reference Extractor SDK



Инструментарий аналитика
RCO Fact Extractor Desktop
RCO Zoom



Архив продуктов (более не поддерживаются)
RCO Syntactic Engine SDK
RCO Semantic Network SDK
RCO Pattern Extractor SDK
RCO Entity Extractor SDK




Форум

Ольга

 27.05.08, 18:13
как вырезать html
Добрый день!
При подготовке xml для индексации столкнулась с проблемой - надо вырезать html-теги из clob и varchar2. oracletext такое позволяет?
С уважением, Ольга
Ответить

Алексей Дмитровский

 27.05.08, 18:20
re: как вырезать html
Добрый день, Ольга!

Что значит - вырезать?
Не индексировать теги или просто получить плоский текст док-та без тэгов?
Ответить

Ольга

 27.05.08, 18:44
re: re: как вырезать html
Добры день, Алексей!
Прочитать плоский текст документа без тегов
Ответить

Алексей Дмитровский

 27.05.08, 18:50
re: re: re: как вырезать html
Для этого есть масса способов, но если хочется именно Oracle Text, то можно использовать ctx_doc.filter или ctx_doc.policy_filter с plaintext=>true
Ответить

Ольга

 27.05.08, 18:51
re: re: re: re: как вырезать html
Спасибо, Алексей.
Попробую.
С уважением, Ольга
Ответить
Новое сообщение






Контакты

тел./факс: +7 495 287-9887    e-mail: info@rco.ru