Внутренний аналитический контейнер данных. Создаётся автоматически внутри при вызове Processor.process(...). Все токены Token ссылаются через поле kit на экземпляр контейнера, связанного с обрабатываемым текстом.Пространство имен: com.pullenti.ner.core
Синтаксис
Свойства (get/set)
Имя | Тип | Описание | |
---|---|---|---|
![]() | getEntities | java.util.ArrayList<Referent> | Список сущностей Referent, выделенных в ходе анализа |
![]() | getSofa setSofa | SourceOfAnalysis | Ссылка на исходный текст |
Методы
Имя | Тип значения | Описание | |
---|---|---|---|
![]() | createReferent | Referent | Создать экземпляр сущности заданного типа |
![]() | debedToken | Token | Убрать метатокен из цепочки, восстановив исходное |
![]() | embedToken | нет | Встроить токен в основную цепочку токенов |
![]() | getAnalyzerDataByAnalyzerName | AnalyzerData | Получить данные, полученные в настоящий момент конкретным анализатором |
![]() | getTextCharacter | char | Получить символ из исходного текста |
![]() | processReferent | ReferentToken | Попытаться выделить с заданного токена сущность указанным анализатором. Используется, если нужно "забежать вперёд" и проверить гипотезу, есть ли тут сущность конкретного типа или нет. |
Поля
Имя | Тип | Описание | |
---|---|---|---|
![]() | baseLanguage | MorphLang | Базовый язык (определяется по тексту) |
![]() | correctedTokens | java.util.HashMap<Token, String> | Токены, подправленные по корректировочному словарю (SourceOfAnalysis.correctionDict). Здесь Value - исходый токен |
![]() | firstToken | Token | Это начало цепочки токенов (первый токен) |
![]() | ontology | ExtOntology | Внешняя онтология - параметр Processor.process(, ...) |
![]() | statistics | StatisticCollection | Статистическая информация |