Продолжается реализация цифрового проекта "Корпус мансийского языка"
Продолжается реализация цифрового проекта "Корпус мансийского языка"
20 марта 2025
Недавно в Думе Югры состоялся круглый стол "Об актуальных вопросах сохранения языков и фольклора коренных малочисленных народов Севера, проживающих в Ханты-Мансийском автономном округе – Югре".
❗Напомним, что команда Югорского НИИ информационных технологий совместно с Депинформтехнологий Югры реализует пилотный проект "Корпус мансийского языка", а также прорабатывает с ФАДН и компанией Яндекс вопрос о включении корпуса мансийского языка в сервис Яндекс Переводчик.
В ходе круглого стола первый заместитель директора ЮНИИИТ Александр Царегородцев отметил, что на сегодняшний день разработана нейросетевая модель машинного переводчика с русского на мансийский язык и обратно. Собранный корпус мансийского языка в 146 тысяч параллельных предложений позволил провести обучение модели автоматического перевода, который, по оценке Института языкознания РАН, является достаточно хорошим. В конце 2024 года в Федеральное агентство по делам национальностей и компанию Яндекс был направлен корпус в 146 тысяч пар предложений на мансийском и русском языках.
▶ В конце 2024 года был запущен Портал мансийского языка: ethnoportal.admhmao.ru. Основные функции портала включают возможность просмотра параллельного корпуса мансийского языка, доступ к автоматическому переводчику и словарю мансийского языка. Работа над его разработкой и наполнением продолжается.
В 2025 году запланирована разработка голосовых моделей для распознавания и генерации мансийской речи. Специалисты Центра развития искусственного интеллекта ЮНИИИТ также намерены создать генеративную модель мансийского языка, способную вести письменный диалог, отвечая на вопросы и учитывая культурные и языковые особенности народа манси.