Параметры создания документа UnitextDocument функцией createDocument

Пространство имен: com.pullenti.unitext

Expand
	imageСинтаксис

Методы

  Имя Тип значения Описание
Public methodprogressнетВ наследной функции можно переопределить это для получения бегунка (используется для PDF, когда он очень большой, то прогресс обработки страниц)

Поля

  Имя Тип Описание
Public fieldcorrectParamsCorrectDocumentParamПараметры корректировки результата (по умолчанию, корректировать всё). Если нужно что-либо отключать, то явно задавайте здесь флажки.
Public fielddontGenerateItemsIdbooleanНе генерировать Id для элементов. По умолчанию false, то есть генерировать.
Public fieldextractPageImageContentbooleanИзвлекать ли картинки для страниц тексто-графических форматов (PDF, DJVU). Используется для OCR распознаваний
Public fieldignoreInnerDocumentsbooleanДля архивов не извлекать файлы, для почтовых форматов игнорировать вложения
Public fieldignoreWord6booleanНе разбирать документы формата Word6 и ранее (иначе выделяет из него только текст, и то не всегда правильно)
Public fieldloadDocumentStructurebooleanЗагружать ли структуру документа, если есть, оформляя её через UnitextDocblock. Сейчас поддержано только для HTML и FB2.
Public fieldmaxImageSizeintПри установке картинки с содержимым большего размера будут игнорироваться
Public fieldmaxTableRowsintМожно поставить ограничитель на число строк таблиц (больше этого порога будут отбрасываться)
Public fieldonlyForPureTextbooleanПризнак того, что создание предназначено только для последующего выделения плоского текста. То есть картинки и пр. можно игнорировать.
Public fieldsetFormulaAsImagebooleanПредставлять формулы MS Word картинками UnitextImage (но без содержимого)
Public fieldsplitTableRowsbooleanРазбивать ли слипшиеся строки таблиц на отдельные строки (когда в ячейках таблицы строки моделируются переходами на новую строку)