Версия 4.0

Внимание! С версии 4.0 для C# нет больше сборок, а SDK распространяется в виде исходных кодов. Соответственно namespace EP теперь называется Pullenti, а структура файлов с классами такая же, как для других языков. Сделана документация для каждого языка в виде html-страниц стиля MSDN. Описание нескольких переименований см. здесь

Версия 3.23

С версии 3.23 у метода GetNormalCaseText второй параметр с bool стал MorphNumber, а также DateExToken упразднён, и функционал выделения относительных дат реализован в рамках обычных дат для DateReferent и DateRangeReferent. У NumberToken теперь Value имеет тип string, а не long. Также NumberExHelper удалён, все функции теперь в NumberToken. Подробности см. здесь

Конвертeр C#.NET => Java & Javascript & Python

Для преобразования проектов C# в исходные коды Java, Javascript и Python использовался конвертер UniSharping, статья с кратким описанием здесь. Скорость работы .NET и Java примерно одинаковая (Java на 15-20% медленнее под Windows, но на других платформах соотношением может быть другим). Скорость работы Python в 20 раз медленнее, чем на .NET. Подозреваю, что основной причиной является неэффективная работа в этих языках с элементами строк (элемент string[i] имеет не тип char, а тоже string из одного элемента со всеми вытекающими накладными расходами, да и вообще примитивные типы valuetype отсутствуют - все являются объектами). Если производительность критична, что можно оформить Pullenti как web-сервер и использовать его из Python. Для Python написана обёртка для облегчения использования SDK Pullenti: Pullenti-Wrapper. Отметим, что в неё обёрнуты только NER-возможности, но многое ещё находится на нижнем уровне, что может быть полезным при анализе (морфология с нормализацией, выделение именных групп, работа с разными числовыми представлениями и пр.). Версия SDK там может быть устаревшая, актуальная только здесь. Скорость работы Javascript в 5 раз медленнее, чем на .NET (в прошлой версии было в 30 раз, но на счёт оптимизации конвертера и корректировки исходного алгоритма в плане уменьшения циклических зависимостей удалось сильно ускорить обработку, для Python тоже стало получше - с 30 опустились до 20).

Документирование SDK

Использование документации - распаковать архив и запустить index.html в любом браузере. Конвертер, который использовался для конвертации кода из C#, доделан под генерацию документации в стиле MSDN. Опробованные doc-конвертеры не понравились, поэтому решили сделать свой. Причём даже удалось как бы объединить "Program Reference", получаемое из комментариев, с внешним документом типа "Program Guide", содержащим общее описание, с восстановлением гиперссылок. Возможно, такого ещё не было... Если такой вариант документации понравится, то могу выложить генератор и сделать описание.

Конвертер C#.NET => PHP

В принципе, конвертер в PHP сделан и Pullenti в него переведён: скорость обработки получилась пока удручающей - на порядок дольше, чем в Python. Вероятно, это связано с тем, что строки в PHP не юникодные, и для работы с ними и моделировании unicode приходится использовать функции mb_..., что негативно сказывается на производительность. Но мы ещё здесь поборемся! SDK пока не выкладываем.