Разные полезные процедурки лингвистического анализа. Особо полезные функции выделены шрифтом.

Пространство имен: Pullenti.Ner.Core

Expand
	imageСинтаксис

Методы

  Имя Тип значения Описание
Public method StaticCanBeEqualCyrAndLatSSboolПроверка на возможную эквивалентность русского и латинского написания одного и того же слова. Например, ИКЕЯ ? IKEA
Public method StaticCanBeEqualCyrAndLatTSboolПроверка на возможную эквивалентность русского и латинского написания одного и того же слова
Public method StaticCanBeEqualCyrAndLatTTboolПроверка на возможную эквивалентность русского и латинского написания одного и того же слова. Например, ИКЕЯ ? IKEA
Public method StaticCanBeEqualsboolСравнение 2-х строк на предмет равенства с учётом морфологии и пунктуации (то есть инвариантно относительно них). Функция довольно трудоёмка, не использовать без крайней необходимости. ВНИМАНИЕ! Вместо этой функции теперь используйте CanBeEqualsEx.
Public method StaticCanBeEqualsExboolСравнение 2-х строк на предмет равенства с учётом морфологии и пунктуации (то есть инвариантно относительно них). Функция довольно трудоёмка, не использовать без крайней необходимости.
Public method StaticCanBeStartOfSentenceboolПроверка того, может ли здесь начинаться новое предложение. Для проверки токена конца предложения используйте CanBeStartOfSentence(t.Next) проверку на начало следующего в цепочке токена.
Public method StaticCheckNumberPrefixTokenПроверка различных способов написания ключевых слов для номеров (ном., №, рег.номер и пр.)
Public method StaticConvertFirstCharUpperAndOtherLowerstringПреобразовать строку, чтобы первая буква стала большой, остальные маленькие
Public method StaticConvertLatinWordToRussianVariantsList<string>Преобразовать слово, написанное по латыни, в варианты на русском языке. Например, "Mikhail" -> "Михаил"
Public method StaticConvertRussianWordToLatinVariantsList<string>Преобразовать слово, написанное в кириллице, в варианты на латинице.
Public method StaticCreateCyrLatAlternativestringПопытка через транслитеральную замену сделать альтернативное написание строки Например, А-10 => A-10 (здесь латиница и кириллица).
Public method StaticFindEndOfSentenceTokenПереместиться на конец предложения
Public method StaticGetAbbreviationstringСделать аббревиатуру для строки из нескольких слов
Public method StaticGetAbsoluteNormalValuestringПолучение абсолютного нормализованного значения (с учётом гласных, удалением невидимых знаков и т.п.). Используется для сравнений различных вариантов написаний. Преобразования: гласные заменяются на *, Щ на Ш, Х на Г, одинаковые соседние буквы сливаются, Ъ и Ь выбрасываются. Например, ХАБИБУЛЛИН - Г*Б*Б*Л*Н
Public method StaticGetPureReferentTokenMetaTokenДля сущности вычислить точное подмножество вхождения. Дело в том, что для некоторых сущностей в диапазон вхождения (ReferentToken) включаются и другие дополнительные сущности. Например, для персоны её атрибуты, должности и т.п., а также контактные даннные за ней, для организации это адреса, реквизиты и пр. Через эту функцию можно получить точное подмножество диапазона, содержащее только эту сущность. Например, для "председатель правления ВТБ Иван Пупкин, +7-905-234-43-21" эта функция вернёт диапазон "Иван Пупкин".
Public method StaticGetTextMorphVarByCaseAndNumberExstringКорректировка числа и падежа строки. Например, GetTextMorphVarByCaseAndNumberEx("год", MorphCase.Nominative, MorphNumber.Undefined, "55") = "лет".
Public method StaticGetTextMorphVarBySamplestringПреобразовать строку в нужный род, число и падеж (точнее, преобразуется первая именная группа), регистр определяется соответствующими символами примера. Морфология определяется по первой именной группе примера. Фукнция полезна при замене по тексту одной комбинации на другую с учётом морфологии и регистра.
Public method StaticGetTextMorphVariantstringПреобразовать строку к нужному падежу и числу. Преобразуется только начало строки, содержащее именную группу или персону.
Public method StaticGetTextValuestringПолучить текст, задаваемый диапазоном токенов. Текст корректируется в соответствии с атрибутами.
Public method StaticGetTextValueOfMetaTokenstringПолучить текст, покрываемый метатокеном. Текст корректируется в соответствии с атрибутами.
Public method StaticHasVowelboolПроверка, что текстовой токен имеет хотя бы одну гласную
Public method StaticIsExistsInDictionaryboolПроверка, что хотя бы одно из слов внутри заданного диапазона находится в морфологическом словаре
Public method StaticIsNotMoreThanOneErrorboolСравнение, чтобы не было больше одной ошибки в написании. Ошибка - это замена буквы или пропуск буквы.
Public method StaticIsTokenAnimateboolПроверка, что токен - "одушевлённая" словоформа
Public method StaticTestAcronymboolПроверка акронима, что из первых букв слов диапазона может получиться проверяемый акроним. Например, РФ = Российская Федерация, ГосПлан = государственный план
Public method StaticTryAttachWordByLettersTokenПроверить написание слова вразбивку по буквам (например: П Р И К А З)