T2DB / Text To Data Bases Характеристики программыWindows-программа, обеспечивающая семантическую обработку неформализованных текстов на русском языке, и извлечение из текстов необходимых пользователю данных.
Краткое описаниеПрограмма предназначена для обработки неформализованных текстов на естественном языке (русском) и заполнения баз данных извлеченными из текста сведениями. Программа является реализацией оригинальной разработки компании НооЛаб - технологии анализа текстов по содержанию ConExT (Content Extracting Technology). На вход программы загружаются произвольные тексты в формате txt, на выход выдаются данные в виде форматированных текстов (формат txt, строка - одна запись, в строке - поля в виде текстовых подстрок, разделенных знаками табуляции). Имеющиеся версии программы обеспечивают извлечение из текстов следующих данных: - предложения текста, простые предложения, входящие в состав сложных;
- подлежащее и сказуемое каждого предложения;
- даты (дни недели, число, месяц, год), упомянутые в тексте;
- географические названия;
- имена персон;
- названия компаний;
- коммуникативные структуры: кто говорит; кому говорит; в каком контексте; текст высказывания.
- адреса компаний: название компании; тип юридического лица; телефон; e-mail; адрес сайта.
- персона-компания-контакты: имя персоны; должность; название компании; тип юридического лица; телефон; e-mail; адрес сайта.
В состав ConExT входит язык высокого уровня tExp, позволяющий легко вносить оперативные изменения в программу T2DB, гибко настраивать ее на различные новые виды данных.
Стоимость, способ заказаСистема поставляется только в рамках крупных заказов, в составе индивидуальных разработок. При необходимости осуществляется доводка под индивидуальные требования заказчика (для совместимости с другими элементами создаваемого комплекса). По вопросам приобретения данной системы или для заказа индивидуальных проектов - обращайтесь по адресу: amfora@noolab.ru, Александр Русин, менеджер проектов / гл.инженер НооЛаб. См. также "контакты". |