Элементы, на которые разбивается исходный текст (токены)Пространство имен: com.pullenti.morph
Синтаксис
Свойства (get/set)
Имя | Тип | Описание | |
---|---|---|---|
![]() | getLanguage setLanguage | MorphLang | Язык(и) |
![]() | getLength | int | Число символов (нормализованного фрагмента = term.length) |
Методы
Имя | Тип значения | Описание | |
---|---|---|---|
![]() | getLemma | String | Лемма (вариант морфологической нормализации) |
![]() | getSourceText | String | Извлечь фрагмент из исходного текста, соответствующий токену |
Поля
Имя | Тип | Описание | |
---|---|---|---|
![]() | beginChar | int | Начальная позиция |
![]() | charInfo | CharsInfo | Информация о токене |
![]() | endChar | int | Конечная позиция |
![]() | tag | Object | Используется произвольным образом |
![]() | term | String | Нормализованный фрагмент исходного текста (верхний регистр, замена некотрых букв) |
![]() | wordForms | java.util.ArrayList<MorphWordForm> | Варианты словоформ |