Различные утилитки работы с текстамиПространство имен: com.pullenti.util
Синтаксис
Методы
| Имя | Тип значения | Описание | |
|---|---|---|---|
![]() | compareTexts | ComapreTextsResult | Проверка совпадения строк, пробелы игнорируются |
![]() | correctNewlinesForParagraphs | String | Исправиление ситуации, когда текстографический формат для размещения слитного фрагмента текста разбивает его на строки (например, для PDF). Производится анализ таких ситуаций и замена переносов на пробелы. |
![]() | correctWhitespaces | String | Получение текста из текстового файла, при этом автоматически определяется кодировка Windows-1251 или DOS и осуществляется соответствующее преобразование (английский текст не изменяется). Также корректируются переходы на новую строку, чтобы везде были бы \r\n . |
![]() | extractText | String | Выделить текст из всех форматов, какие только поддерживаются (кроме архивов) |
![]() | getWords | java.util.List<String> | Преобразовать текст в список слов (разделителем является любой пробельный символ) |
![]() | readStringFromFile | String | Считывание текста из текстового файла. Кодировка файла определяется префиксом. Поддерживаются такие префиксы: EF BB BF - для UTF8 FF FE или FE FF - для Unicode, младний байт раньше Если префикс не задан, то подразумевается Windows-1251 |
![]() | writeString1251ToFile | нет | Сохранить строку в файле в кодировке Windows-1251 |
![]() | writeStringToFile | нет | Сохранение текста в файл. Формат UTF-8, вставляется префикс EF BB BF. |
