Сохранение языкового разнообразия с помощью ИИ: выступление эксперта ЮНИИИТ на конференции ЮНЕСКО

Сохранение языкового разнообразия с помощью ИИ: выступление эксперта ЮНИИИТ на конференции ЮНЕСКО

01 июля 2025
Сохранение языкового разнообразия с помощью ИИ: выступление эксперта ЮНИИИТ на конференции ЮНЕСКО
На XVI Международном IT-Форуме с участием стран БРИКС и ШОС в рамках круглого стола ЮНЕСКО «Информационные технологии и системы ИИ в развитии многоязычия» с докладом выступил Главный эксперт Центра развития искусственного интеллекта ЮНИИИТ Одилжон Негматулоев.

Тема его выступления — «Сохранение и развитие малоресурсных языков с помощью машинного обучения» — крайне актуальна в эпоху цифровизации. Из почти 7000 языков мира более 40% находятся под угрозой исчезновения, а технологии ИИ могут стать ключевым инструментом для их сохранения.

В Югре ведутся работы по реализации проекта «Национальный корпус мансийского языка», который ориентирован на использование цифровых технологий для сохранения родных языков коренных малочисленных народов. Команда ЮНИИИТ совместно с Депинформтехнологий Югры, Департаментом образования и науки Югры и Департаментом молодежной политики Югры работают над этим проектом.

За цифровую составляющую проекта ответственны специалисты Центра развития искусственного интеллекта ЮНИИИТ. На данный момент: запущен онлайн переводчик с мансийского на русский язык и обратно, опубликован Портал мансийского языка - ethnoportal.admhmao.ru, разработана и опубликована в Сети нейросетевая модель распознавания языковых символов - huggingface.co/URIIT/mns-.... Сервис позволяет распознавать текст на мансийском языке с изображения и преобразовывает его в обычный текст. В дальнейшем сервис будет интегрирован в вышеуказанный этнопортал.

Все это говорит о планомерном развитии проекта.

Планы в отношении данного проекта касаются, с одной стороны, увеличения базы языка в цифровом мире, а с другой – поиска новых точек применения языков коренных малочисленных народов севера. Возможно, в скором времени мы «увидим» нейросеть, которая будет сочинять и читать сказки на мансийском языке.

Другими вопросами круглого стола стали:
- Большие и малые языковые модели: как адаптировать технологии для редких языков?
- ML и NLP для документирования малых языков: автоматизация анализа и сохранения лингвистических данных.
- Виртуальные языковые сообщества: как ИИ помогает объединять носителей и популяризировать языки?
- Этически нейтральный ИИ: как избежать biases и обеспечить инклюзивность?
- Краудсорсинг и коллаборации: массовое участие в сохранении языкового наследия.

Работы в этом направлении не только поддерживают культурное разнообразие, но и открывают новые возможности для образования, науки и глобального диалога.

Благодарим Одилжона Негматулоева и всех участников встречи за вклад в эту важную дискуссию!

Возврат к списку