Базовый класс для всех токенов. Наследные классы -
TextToken (конечная словоформа) и
MetaToken (связный фрагмент других токенов).
Пространство имен: Pullenti.Ner
Синтаксис
CSharp |
public class Token |
Свойства (get/set)
|
Имя |
Тип |
Описание |
| BeginChar | int | Позиция в тексте начального символа |
| EndChar | int | Позиция в тексте конечного символа |
| IsAnd | bool | Это соединительный союз И (на всех языках) |
| IsComma | bool | Это запятая |
| IsCommaAnd | bool | Это запятая или союз И |
| IsHiphen | bool | Это символ переноса |
| IsIgnored | bool | Игнорировать токен при обработке |
| IsLetters | bool | Признак того, что это буквенный текстовой токен (TextToken) |
| IsNewlineAfter | bool | Элемент заканчивает строку.
Для последнего элемента всегда true. |
| IsNewlineBefore | bool | Элемент начинается с новой строки.
Для 1-го элемента всегда true. |
| IsOr | bool | Это соединительный союз ИЛИ (на всех языках) |
| IsTableControlChar | bool | Это спец-символы для табличных элементов (7h, 1Eh, 1Fh) |
| IsWhitespaceAfter | bool | Наличие пробельных символов после |
| IsWhitespaceBefore | bool | Наличие пробельных символов перед |
| LengthChar | int | Длина в текстовых символах |
| Morph | MorphCollection | Морфологическая информация |
| NewlinesAfterCount | int | Количество переходов на новую строку перед |
| NewlinesBeforeCount | int | Количество переходов на новую строку перед |
| Next | Token | Следующий токен в цепочке токенов |
| Previous | Token | Предыдущий токен в цепочке токенов |
| WhitespacesAfterCount | int | Количество пробелов перед, переход на новую строку = 10, табуляция = 5 |
| WhitespacesBeforeCount | int | Количество пробелов перед, переход на новую строку = 10, табуляция = 5 |
Методы
|
Имя |
Тип значения |
Описание |
| GetMorphClassInDictionary | MorphClass | Проверка, что слово есть в словаре соответствующего языка |
| GetNormalCaseText | string | Получить связанный с токеном текст в именительном падеже |
| GetReferent | Referent | Получить ссылку на сущность (не null только для ReferentToken) |
| GetReferents | List<Referent> | Получить список ссылок на все сущности, скрывающиеся под элементом.
Дело в том, что одни сущности могут накрывать другие (например, адрес накроет город). |
| GetSourceText | string | Получить фрагмент исходного текста, связанный с токеном |
| IsChar | bool | Токен состоит из конкретного символа |
| IsCharOf | bool | Токен состоит из одного символа, который есть в указанной строке |
| IsValue | bool | Проверка конкретного значения слова (с учётом морф.вариантов) |
| IsValue2 | bool | Проверка двух подряд идущих слов (с учётом морф.вариантов) |
| IsValue3 | bool | Проверка трёх подряд идущих слова (с учётом морф.вариантов) |
Поля
|
Имя |
Тип |
Описание |
| Chars | CharsInfo | Информация о символах |
| Kit | AnalysisKit | Аналитический контейнер |
| Tag | object | Используется произвольным образом |