Различные утилитки работы с текстами

Пространство имен: com.pullenti.util

Expand
	imageСинтаксис

Методы

  Имя Тип значения Описание
Public method StaticcompareTextsComapreTextsResultПроверка совпадения строк, пробелы игнорируются
Public method StaticcorrectNewlinesForParagraphsStringИсправиление ситуации, когда текстографический формат для размещения слитного фрагмента текста разбивает его на строки (например, для PDF). Производится анализ таких ситуаций и замена переносов на пробелы.
Public method StaticcorrectWhitespacesStringПолучение текста из текстового файла, при этом автоматически определяется кодировка Windows-1251 или DOS и осуществляется соответствующее преобразование (английский текст не изменяется). Также корректируются переходы на новую строку, чтобы везде были бы \r\n .
Public method StaticextractTextStringВыделить текст из всех форматов, какие только поддерживаются (кроме архивов)
Public method StaticgetWordsjava.util.List<String>Преобразовать текст в список слов (разделителем является любой пробельный символ)
Public method StaticreadStringFromFileStringСчитывание текста из текстового файла. Кодировка файла определяется префиксом. Поддерживаются такие префиксы: EF BB BF - для UTF8 FF FE или FE FF - для Unicode, младний байт раньше Если префикс не задан, то подразумевается Windows-1251
Public method StaticwriteString1251ToFileнетСохранить строку в файле в кодировке Windows-1251
Public method StaticwriteStringToFileнетСохранение текста в файл. Формат UTF-8, вставляется префикс EF BB BF.