Meta создала речевую модель искусственного интеллекта.
Она не является клоном ChatGPT, сообщает Engadget.
Проект компании Massively Multilingual Speech может распознавать более 4 тыс. разговорных языков и воспроизводит речь более чем на 1,1 тыс. языках. Meta предоставляет открытый доступ к MMS, чтобы помочь сохранить языковое разнообразие и поощрить исследователей развивать его на этой основе.
Модели распознавания речи и преобразования текста в речь обычно должны учиться на тысячах часов аудиозаписей с сопроводительными транскрипционными метками, которые позволяют алгоритмам правильно классифицировать и "понимать" данные. Но таких данных не существует для языков, которые находятся под угрозой исчезновения в ближайшие десятилетия.
Meta применила нетрадиционный подход к сбору аудиоданных. Это прослушивание аудиозаписей переведенных религиозных текстов.
ЧИТАЙТЕ ТАКЖЕ: Компания Google анонсировала генеративный ИИ, который кардинально изменит поиск
"Хотя содержание аудиозаписей является религиозным, наш анализ показывает, что это не влияет на то, что модель продуцирует больше религиозного языка. Мы считаем, что это потому, что мы используем подход коннекционистской временной классификации, который намного ограниченнее если сравнивать с большими языковыми моделями или моделями последовательности для распознавания речи", – говорится в сообщении.
После обучения модели выравнивания, чтобы сделать данные более подходящими для использования, Меtа использовала wav2vec 2.0, модель "самоконтролируемого обучения речевого представления". Она может учиться на немаркированных данных. Компания сравнила MMS с Whisper от OpenAI. Результаты превзошли ожидания.
"Мы обнаружили, что модели, обученные данным Massively Multilingual Speech, имеют вдвое меньший процент ошибок в словах, но Massively Multilingual Speech охватывает в 11 раз больше языков", – сообщает Meta.
Корпорация Google объявила о работе над искусственным интеллектом, который мог бы помочь диагностировать рак и анализировать результаты ультразвуковых исследований.
Модели искусственного интеллекта компании могут помочь упростить процесс раннего выявления рака молочной железы и определения срока беременности у будущих матерей.
Для реализации проекта Google сотрудничает с некоммерческой кенийской организацией Jacaranda Health для исследования ультразвукового лечения матерей и младенцев на основе искусственного интеллекта в государственных больницах.
Комментарии