Запатентован модуль препроцессинга неструктурированного текста с применением технологий ИИ

Запатентован модуль препроцессинга неструктурированного текста с применением технологий ИИ

Специалистами IT-лаборатории Межотраслевого инжинирингового центра «Композиты России» МГТУ им. Н.Э. Баумана была разработана программа для очистки текста от неинформативных признаков. В основе программы лежат алгоритмы искусственного интеллекта.

Разработанная программа очищает текст от лишних знаков препинания, предлогов, специальных символов и подобных элементов, в которых отсутствует информативность. Кроме того, как отмечают разработчики, программа осуществляет приведение к нижнему регистру шрифта, лемматизацию текста и токенизацию, создание словаря на основе модели «Bag of Words».

В разработанном модуле препроцессинга используются фирменные скрипты, разработанные в МГТУ имени Баумана, которые работают вместе с IT-брокерами, ответственными за подачу данных в режиме реального времени или по расписанию. Программа востребована в промышленных секторах экономики России.

 

Межотраслевой инжиниринговый центр «Композиты России» – это структурное подразделение МГТУ им. Н.Э. Баумана, созданное 15 июня 2011 года для содействия в разработке, производстве и коммерциализации высокотехнологичных решений университета в области новых материалов и информационных технологий, формирования научного задела и современных образовательных технологий и программ. Деятельность Центра осуществляется при поддержке Минобрнауки и Минпромторга России в рамках исполнения поручения Правительства Российской Федерации. Центр реализует «замкнутый цикл» инжиниринговых и научно-образовательных услуг, от разработки до внедрения технологий и промышленной продукции в ключевые сектора экономики РФ, такие как: транспортный, строительный, ЖКХ, энергетический, нефтегазовый, медицинский и IT.

МГТУ имени Н.Э. Баумана – национальный исследовательский университет, один из крупнейших в России и Европе. Бауманский университет является лидером среди российских вузов по общему объему НИОКР (ежегодно до 6 млрд. рублей). В МГТУ им. Баумана создана инновационная структура, включающая в себя 22 научно-образовательных центра мирового уровня. Особенностью научно-образовательных центров является их междисциплинарность, что позволят создавать технологический прорыв на стыке наук. Общая численность консолидированного коллектива университета (студенты, сотрудники и преподаватели) 35 тысяч человек.

Опубликовано 04 февраля 2021 года

#