ИВ РАН

Новости ИВ РАН

16 июня 2024 года

ИВ РАН и IT-компании открыли новые таланты на AI Product Hackathon 2024

ИВ РАН и IT-компании открыли новые таланты на AI Product Hackathon 2024 ИВ РАН и IT-компании открыли новые таланты на AI Product Hackathon 2024

 
С 31 мая по 16 июня 2024 года состоялся 4-й Хакатон (AI Product Hackathon). Это конкурс для разработчиков программного обеспечения, программистов, дизайнеров, менеджеров и других IT-специалистов, во время которого команды решают представленные «кейсодателями» бизнес-задачи с использованием AI-технологий. Организаторами выступили Yandex Cloud, Napoleon IT и AI Talent Hub.

Каждый из четырех партнеров Хакатона – Лемана ПРО (Леруа Мерлен), Ситилинк, Институт востоковедения РАН, Группа НМЛК – предоставили участникам темы своих проектов, которые предлагалось воплотить в жизнь с помощью генеративной модели YandexGPT или других аналогичных Machine Learning решений. В течение двух недель 65 команд из 20 регионов СНГ соревновались в четырех выбранных направлениях. В итоге 28 команд смогли представить свои решения экспертам, пройдя 26 часов консультаций, QA-сессии и промежуточные этапы проверки работы.

ИВ РАН поставил задачу создать русскоговорящий чат-бот для анализа СМИ на китайском и японском языках – систему с использованием генеративных моделей, в том числе машинного перевода, для анализа новостных сообщений в информационном пространстве стран Восточной Азии, прежде всего КНР и Японии. При этом были оговорены основные условия: запросы принимаются на русском языке, ответы или цепочки логических выводов также выдаются на русском языке; каждый факт или утверждение, предоставляемые в ответе, должны сопровождаться ссылками на источники; модель должна дообучаться, учитывая ежедневно динамически поступающие сообщения, и отвечать с учетом самых последних новостей. Для эксперимента участникам были предоставлены японский и китайский датасеты объемом 1,7 млн сообщений каждый.

В состав экспертов помимо технических специалистов от организаторов Хакатона вошли с.н.с. Лаборатории цифровых исследований современного Востока ИВ РАН А.В. Костыркин, с.н.с. Центра «Россия, Китай, мир» ИКСА РАН А.Ч. Мокрецкий, м.н.с. Центра политических исследований и прогнозов ИКСА РАН и м.н.с. Центра изучения современного Китая ИВ РАН Р.Ф. Кудакаев.

Победителем стала команда backpropagation.ai, использовавшая в своем решении схему Retrieval Augmented Generation, которая позволяет по запросу пользователя найти необходимые документы в векторной базе данных, после чего передает их в виде специального «промта» на вход генеративной модели для составления резюмированного ответа. Это и идейно близкие решения других финалистов могут быть масштабированы для включения других восточных языков и расширения экспериментального датасета потоковыми онлайн данными.


Курсы восточных языков ИВ РАН