SDK Unitext - библиотека для выделения текстов из файлов различных форматов, таких как Doc, Docx, Pdf, Rft и других. Выделяются не только тексты, но и таблицы, списки, сноски, аннотации и другие структурирующие текст элементы, а также картинки.
Исходный код Java и эта документация сгенерированы программой Unisharping.

Пакеты

  Имя Описание
Namespacecom.pullenti.unitextУниверсальное структурно-текстовое представление документа
Namespacecom.pullenti.unitext.internal.html 
Namespacecom.pullenti.unitext.internal.rtf 
Namespacecom.pullenti.utilПолезные хелперы