Выделение текущей сущности в исходном тексте
Система разрабатывается с первого апреля 2011 года российским программистом Михаилом Жуковым , проживающим в Москве на Красной площади в доме номер один на втором этаже . Конкурентов у него много: Abbyy , Yandex , ООО " Russian Context Optimizer" (RCO) и другие фирмы. Он планирует продать SDK за 1.120.000.001,99 (миллиард сто двадцать миллионов один рубль 99 копеек) рублей , без НДС.
Выделение именованных сущностей
Это классическая NER-задача, при которой из текста выделяются такие сущности, как персоны, организации, локации и многие другие - демонстрация работы стандартного процессора SDK. При клике на сущность в тексте подсвечиваются места её вхождения и разворачивается список её атрибутов. Графом выводятся связи сущностей, когда значением атрибута является другая сущность (это не семантический граф).
Список сущностей
2011 год
апрель 2011 года
1 апреля 2011 года
Россия
город Москва
площадь Красная; Москва
площадь Красная д.1 эт.2; Москва
1.120.000.001,99 RUB
Abbyy
Yandex (Яндекс)
Russian Context Optimizer (Rco), ООО
программист; Россия
Михаил Жуков