Элементы, на которые разбивается исходный текст (токены)Пространство имен: Pullenti.Morph
Синтаксис
Свойства (get/set)
Имя | Тип | Описание | |
---|---|---|---|
Language | MorphLang | Язык(и) | |
Length | int | Число символов (нормализованного фрагмента = Term.Length) |
Методы
Имя | Тип значения | Описание | |
---|---|---|---|
GetLemma | string | Лемма (вариант морфологической нормализации) | |
GetSourceText | string | Извлечь фрагмент из исходного текста, соответствующий токену |
Поля
Имя | Тип | Описание | |
---|---|---|---|
BeginChar | int | Начальная позиция | |
CharInfo | CharsInfo | Информация о токене | |
EndChar | int | Конечная позиция | |
Tag | object | Используется произвольным образом | |
Term | string | Нормализованный фрагмент исходного текста (верхний регистр, замена некотрых букв) | |
WordForms | List<MorphWordForm> | Варианты словоформ |