Продолжается реализация цифрового проекта "Корпус мансийского языка"

Продолжается реализация цифрового проекта "Корпус мансийского языка"

20 марта 2025
Продолжается реализация цифрового проекта "Корпус мансийского языка"
Недавно в Думе Югры состоялся круглый стол "Об актуальных вопросах сохранения языков и фольклора коренных малочисленных народов Севера, проживающих в Ханты-Мансийском автономном округе – Югре".

❗Напомним, что команда Югорского НИИ информационных технологий совместно с Депинформтехнологий Югры реализует пилотный проект "Корпус мансийского языка", а также прорабатывает с ФАДН и компанией Яндекс вопрос о включении корпуса мансийского языка в сервис Яндекс Переводчик.

В ходе круглого стола первый заместитель директора ЮНИИИТ Александр Царегородцев отметил, что на сегодняшний день разработана нейросетевая модель машинного переводчика с русского на мансийский язык и обратно. Собранный корпус мансийского языка в 146 тысяч параллельных предложений позволил провести обучение модели автоматического перевода, который, по оценке Института языкознания РАН, является достаточно хорошим. В конце 2024 года в Федеральное агентство по делам национальностей и компанию Яндекс был направлен корпус в 146 тысяч пар предложений на мансийском и русском языках.

▶ В конце 2024 года был запущен Портал мансийского языка: ethnoportal.admhmao.ru. Основные функции портала включают возможность просмотра параллельного корпуса мансийского языка, доступ к автоматическому переводчику и словарю мансийского языка. Работа над его разработкой и наполнением продолжается.

В 2025 году запланирована разработка голосовых моделей для распознавания и генерации мансийской речи. Специалисты Центра развития искусственного интеллекта ЮНИИИТ также намерены создать генеративную модель мансийского языка, способную вести письменный диалог, отвечая на вопросы и учитывая культурные и языковые особенности народа манси.

Возврат к списку