Коллекция разных средств лингвистического анализа

Классы

  Имя Описание
Public classAnalysisKitВнутренний аналитический контейнер данных. Создаётся автоматически внутри при вызове Processor.Process(...). Все токены Token ссылаются через поле Kit на экземпляр контейнера, связанного с обрабатываемым текстом.
Public classAnalyzerDataДанные, полученные в ходе обработки одним анализатором. Каждый анализатор сохраняет в своём класса свои данные, получаемые в ходе анализа. В конце процессор объединяет их все. Получить экземпляр, связанный с анализатором, можно методом AnalyzerKit.GetAnalyzerDataByAnalyzerName.
Public classBracketHelperПоддержка анализа скобок и кавычек
Public classBracketSequenceTokenМетатокен - представление последовательности, обрамлённой кавычками (скобками)
Public classConjunctionHelperПоддержка работы с союзами (запятая тоже считается союзом). Союзы могут быть из нескольких слов, например, "а также и".
Public classConjunctionTokenМетатокен - представление союзов и других служебных слов. Они могут быть из нескольких токенов, например, "из-за того что". Получить можно с помощью ConjunctionHelper.TryParse(t)
Public classMiscHelperРазные полезные процедурки лингвистического анализа. Особо полезные функции выделены шрифтом.
Public classNounPhraseHelperВыделение именных групп - это существительное с согласованными прилагательными (если они есть).
Public classNounPhraseMultivarTokenВариант расщепления именной группы, у которой слиплись существительные. Получается методом GetMultivars() у NounPhraseToken, у которой MultiNouns = true.
Public classNounPhraseTokenМетатокен - именная группа (это существительное с возможными прилагательными, морфологичски согласованными). Выделяется методом TryParse() класса NounPhraseHelper.
Public classNumberHelperРабота с числовыми значениями
Public classPrepositionHelperПоддержка работы с предлогами
Public classPrepositionTokenМетатокен - предлог (они могут быть из нескольких токенов, например, "несмотря на", "в соответствии с"). Создаётся методом PrepositionHelper.TryParse(t).
Public classSerializeHelperСериализация сущностей
Public classStatisticBigrammInfoСтатистическая информация о биграмме - возвращается StatisticCollection.GetBigrammInfo
Public classStatisticCollectionСтатистическая информация о словоформах и их биграммах в тексте - поле AnalysisKit.Statistic.
Public classStatisticWordInfoСтатистическая информация о токене - возвращается StatisticCollection.GetWordInfo
Public classTerminТермин, понятие, система обозначений чего-либо и варианты его написания. Элемент словаря TerminCollection.
Public classTerminCollectionСловарь некоторых обозначений, терминов, сокращений. Очень полезный класс! Рассчитан на быстрый поиск токена или группы токенов среди большого списка терминов.
Public classTerminTokenМетатокен - результат привязки термина Termin словаря TerminCollection. Формируется методом TryParse или TryParseAll у TerminCollection.
Public classVerbPhraseHelperРабота с глагольными группами (последовательность из глаголов и наречий)
Public classVerbPhraseItemTokenЭлемент глагольной группы VerbPhraseToken
Public classVerbPhraseTokenМетатокен - глагольная группа (последовательность глаголов, наречий и причастий). Создаётся методом VerbPhraseHelper.TryParse.

Перечисления

  Имя Описание
Public enumBracketParseAttrАтрибуты выделения последовательности между скобок-кавычек. Битовая маска.
Public enumCanBeEqualsAttrАтрибуты функции CanBeEqualsEx класса MiscHelper. Битовая маска.
Public enumConjunctionTypeТипы союзов и служебных слов
Public enumGetTextAttrАтрибуты получения текста методами GetTextValue и GetTextValueOfMetaToken класса MiscHelper. Битовая маска.
Public enumNounPhraseParseAttrАтрибуты выделения именных групп NounPhraseHelper.TryParse(). Битовая маска.
Public enumReferentsEqualTypeАтрибут сравнения сущностей (методом Referent.CanBeEquals)
Public enumTerminParseAttrАтрибуты привязки токена к термину словаря TerminCollection методом TryParse. Битовая маска.