НИТУ «МИСиС» представляет Data Science-платформу с мультиязычным поиском

113

Центр исследования больших данных НИТУ «МИСиС» запускает платформу анализа больших данных IRELA, говорится в пресс-релизе организации. Новая Data Science-платформа не заточена под конкретную отрасль и легко может быть встроена в IT-ландшафт организаций из любых сфер деятельности за счет многомодульности. IRELA также обладает мультиязычным поиском, что является уникальным для российского рынка, сказано в сообщении.

Data Science-платформа IRELA разработана экспертами Центра исследования больших данных НИТУ «МИСиС» совместно с инженерами компании Naumen. Проект опирается на передовые научные достижения в области Data Science и основан на аналитических решениях, созданных экспертами Центра по заказу ведущих компаний из нефтегазовой, аэрокосмической, строительной и научно-образовательной отраслей.

За счет технологий обработки больших данных и машинного обучения платформа IRELA автоматизирует работу с большим потоком информации: упрощает поиск по многоязычной базе данных, классифицирует входящие документы, ускоряет принятие стандартных решений, подсказывает приоритеты в работе с обращениями, облегчает анализ отчетов. Представленная разработка позволяет эффективно использовать базу знаний компании и быстро отвечать на поступающие запросы.

Платформа отличается широким спектром применения. В отличие от других подобных решений на рынке, заточенных под конкретную область, IRELA предоставляет набор инструментов, которые встраиваются в существующий ИТ-ландшафт организации. Такие конкурентные преимущества достигаются благодаря разделению платформы на относительно независимые функциональные части — модули. Каждый из них — готовое решение, которое можно устанавливать отдельно или в комплекте с другими.

«Мы собрали сильную команду экспертов по Data Science, которые умеют разрабатывать решения в сфере анализа данных и обладают опытом внедрения созданных технологий в рамках проектов с коммерческими и государственными заказчиками, среди которых министерства и корпорации, — комментирует Григорий Губарев, руководитель проекта. — Мы постарались сделать по-настоящему конкурентный продукт и спроектировали многомодульную платформу, благодаря которой решения Data Science станут доступнее для внедрения не только в крупных, но и в средних компаниях. Кроме того, IRELA обладает функцией мультиязычного поиска, аналогов которому пока нет на российском рынке».

Модуль мультиязычности находит в коллекции документы на любых языках, исключая необходимость перевода и связанные с ним ошибки. Он сокращает время поиска для пользователей, не владеющих нужными иностранными языками, и увеличивает шанс найти наиболее подходящий по смыслу документ. Модуль актуален для глобальных компаний и многонациональных коллективов, работающих с зарубежными контрагентами. Технология мультиязычного поиска — собственная разработка команды, которая была представлена на международных научных конференциях и описана в авторитетных научных журналах.

Лев Голицын, директор Центра исследования больших данных НИТУ «МИСиС»: «Центр занимается актуальными направлениями анализа информации, машинного обучения и обработки естественного языка, и платформа IRELA — первый важный проект подразделения. Созданная платформа включает наши передовые достижения, полученные за счет симбиоза решенных бизнес-кейсов и научных задач».

Справка

Центр исследования больших данных НИТУ «МИСиС» создан в 2018 году в Национальном исследовательском технологическом университете «МИСиС» в партнерстве с российской ИТ-компанией Naumen. В центре проводятся поисковые и прикладные научные исследования в области технологий интеллектуальной обработки неструктурированных данных. В подразделении с помощью методов Data Science разрабатываются программные решения по таким направлениям, как автоматическая обработка естественного языка, разведочный информационный поиск, кросс-язычный поиск данных, мультимодальное тематическое моделирование, языковое моделирование, векторное представление сущностей, вопросно-ответные системы, системы поддержки принятия решений. В состав центра входят эксперты в области анализа данных, машинного обучения и компьютерной лингвистики, а также инжиниринга информационных систем. Ведется и научно-методическая деятельность: разработка образовательных курсов, организация и проведение лекций, семинаров и конференций. Среди задач центра — вовлечение студентов и аспирантов вуза в создание передовых наукоемких решений в сфере Data Science, востребованных на рынке.

ВАШ КОММЕНТАРИЙ:

Please enter your comment!
Please enter your name here

два × 5 =