Meta створила мовну модель штучного інтелекту.
Вона не є клоном ChatGPT, повідомляє Engadget.
Проєкт компанії Massively Multilingual Speech може розпізнавати понад 4 тис. розмовних мов і відтворює мовлення більш ніж 1,1 тис. мовами. Meta надає відкритий доступ до MMS, щоб допомогти зберегти мовне розмаїття та заохотити дослідників розвивати його на цій основі.
Моделі розпізнавання мовлення та перетворення тексту в мовлення зазвичай повинні навчатися на тисячах годин аудіозаписів із супровідними транскрипційними мітками, які дозволяють алгоритмам правильно класифікувати та "розуміти" дані. Але таких даних не існує для мов, які перебувають під загрозою зникнення в найближчі десятиліття.
Meta застосувала нетрадиційний підхід до збору аудіоданих. Це прослуховування аудіозаписів перекладених релігійних текстів.
ЧИТАЙТЕ ТАКОЖ: Компанія Google анонсувала генеративний ШІ, який кардинально змінить пошук
"Хоча зміст аудіозаписів є релігійним, наш аналіз показує, що це не впливає на те, що модель продукує більше релігійної мови. Ми вважаємо, що це тому, що ми використовуємо підхід коннекціоністської часової класифікації, який є набагато обмеженішим, якщо порівняти з великими мовними моделями або моделями послідовності для розпізнавання мовлення", – йдеться у повідомленні.
Після навчання моделі вирівнювання, щоб зробити дані придатнішими для використання, Меtа використала wav2vec 2.0, модель "самоконтрольованого навчання мовленнєвого представлення". Вона може навчатися на немаркованих даних. Компанія порівняла MMS з Whisper від OpenAI. Результати перевершили очікування.
"Ми виявили, що моделі, навчені на даних Massively Multilingual Speech, мають вдвічі менший відсоток помилок у словах, але Massively Multilingual Speech охоплює в 11 разів більше мов", – повідомляє Meta.
Корпорація Google оголосила про роботу над штучним інтелектом, який допоміг би діагностувати рак та аналізувати результати ультразвукових досліджень.
Моделі штучного інтелекту компанії можуть допомогти спростити процес раннього виявлення раку молочної залози та визначення терміну вагітності у майбутніх матерів.
Для реалізації проєкту, Google співпрацює з кенійською некомерційною організацією Jacaranda Health для дослідження ультразвукового лікування матерів та немовлят на основі штучного інтелекту у державних лікарнях.
Коментарі