Базовый класс для всех токенов. Наследные классы - TextToken (конечная словоформа) и MetaToken (связный фрагмент других токенов).

Пространство имен: com.pullenti.ner

Expand
	imageСинтаксис

Свойства (get/set)

  Имя Тип Описание
Public propertygetBeginCharintПозиция в тексте начального символа
Public propertygetEndCharintПозиция в тексте конечного символа
Public propertyisAndbooleanЭто соединительный союз И (на всех языках)
Public propertyisCommabooleanЭто запятая
Public propertyisCommaAndbooleanЭто запятая или союз И
Public propertyisHiphenbooleanЭто символ переноса
Public propertyisIgnoredbooleanИгнорировать токен при обработке
Public propertyisLettersbooleanПризнак того, что это буквенный текстовой токен (TextToken)
Public propertyisNewlineAfter
setNewlineAfter
booleanЭлемент заканчивает строку. Для последнего элемента всегда true.
Public propertyisNewlineBefore
setNewlineBefore
booleanЭлемент начинается с новой строки. Для 1-го элемента всегда true.
Public propertyisOrbooleanЭто соединительный союз ИЛИ (на всех языках)
Public propertyisTableControlCharbooleanЭто спец-символы для табличных элементов (7h, 1Eh, 1Fh)
Public propertyisWhitespaceAfter
setWhitespaceAfter
booleanНаличие пробельных символов после
Public propertyisWhitespaceBefore
setWhitespaceBefore
booleanНаличие пробельных символов перед
Public propertygetLengthCharintДлина в текстовых символах
Public propertygetMorph
setMorph
MorphCollectionМорфологическая информация
Public propertygetNewlinesAfterCountintКоличество переходов на новую строку перед
Public propertygetNewlinesBeforeCountintКоличество переходов на новую строку перед
Public propertyTokenСледующий токен в цепочке токенов
Public propertyTokenПредыдущий токен в цепочке токенов
Public propertygetWhitespacesAfterCountintКоличество пробелов перед, переход на новую строку = 10, табуляция = 5
Public propertygetWhitespacesBeforeCountintКоличество пробелов перед, переход на новую строку = 10, табуляция = 5

Методы

  Имя Тип значения Описание
Public methodgetMorphClassInDictionaryMorphClassПроверка, что слово есть в словаре соответствующего языка
Public methodgetNormalCaseTextStringПолучить связанный с токеном текст в именительном падеже
Public methodgetReferentReferentПолучить ссылку на сущность (не null только для ReferentToken)
Public methodgetReferentsjava.util.ArrayList<Referent>Получить список ссылок на все сущности, скрывающиеся под элементом. Дело в том, что одни сущности могут накрывать другие (например, адрес накроет город).
Public methodgetSourceTextStringПолучить фрагмент исходного текста, связанный с токеном
Public methodisCharbooleanТокен состоит из конкретного символа
Public methodisCharOfbooleanТокен состоит из одного символа, который есть в указанной строке
Public methodisValuebooleanПроверка конкретного значения слова (с учётом морф.вариантов)
Public methodisValue2booleanПроверка двух подряд идущих слов (с учётом морф.вариантов)
Public methodisValue3booleanПроверка трёх подряд идущих слова (с учётом морф.вариантов)

Поля

  Имя Тип Описание
Public fieldcharsCharsInfoИнформация о символах
Public fieldkitAnalysisKitАналитический контейнер
Public fieldtagObjectИспользуется произвольным образом