Система Omnilingual ASR, разработанная компанией Meta во взаимодействии с международными платформами — Mozilla Common Voice, Lanfrica, Naija Voices и другими, объединяет огромные объёмы речевых данных, собранных по всему миру.
Она обучает искусственный интеллект распознаванию человеческой речи, в том числе языков, которые раньше не были представлены в цифровой среде.
Абхазский язык оказался в системе через открытую платформу Mozilla Common Voice, где сбор данных ведётся онлайн самими носителями языка.
В 2022 году Благотворительный Фонд развития абхазского языка имени Баграта Шинкуба организовал кампанию по записи абхазской речи: более 400 человек приняли участие в проекте, озвучивая тексты и формируя открытую базу данных.
Проектную команду возглавил программист и специалист в области искусственного интеллекта Нарт Тлышэ.
Эти данные стали частью международного корпуса Mozilla Common Voice, а затем — через сотрудничество Mozilla и Meta — были интегрированы в систему Omnilingual ASR.
На карте системы Meta абхазский язык отмечен как надёжный (Safe) — это означает, что его данные прошли проверку и обеспечивают стабильное качество распознавания.
«Появление абхазского языка в Omnilingual ASR — это не просто технологический факт, а шаг, который открывает новое направление для будущей работы.
Сейчас система распознаёт абхазскую речь и преобразует её в текст — это уже огромный прорыв.
Но ещё важнее то, что теперь открыта возможность дальнейшей интеграции языка в другие направления искусственного интеллекта — озвучивание текстов, автоматический перевод и создание голосовых интерфейсов на абхазском языке», – считает Лагулаа.
Таким образом, создана прочная основа для развития технологий, которые сделают абхазский язык живым участником цифрового мира.
Этот результат подтверждает правильность стратегического пути Фонда имени Баграта Шинкуба — интеграции абхазского языка в международные открытые платформы и сотрудничества с ведущими ИИ-системами.
Наряду с этим возникают новые возможности и вызовы.
Вызовы связаны с необходимостью идти в ногу с технологическим прогрессом, адаптироваться к изменениям и быстро реагировать на динамично развивающиеся рынки.
С другой стороны, открываются новые возможности, такие как комплексные ИИ-системы, например ChatGPT, и ИИ-агенты для туризма, образования и многих других отраслей.
Фонд благодарит всех, кто участвовал в кампании 2022 года и записал свои голоса
«Именно благодаря вам абхазский язык сегодня звучит в системах искусственного интеллекта. Каждый, кто тогда озвучил текст, уже внес свой вклад в цифровое будущее языка», – отметил Лагулаа.
Фонд им. Б. Шинкуба приглашает всех желающих присоединиться к продолжению этой работы.
В ближайшие дни Фонд представит новые проекты и шаги, которые станут следующей вехой в деле цифрового развития абхазского языка.





