Google розробила надсучасний синтезатор мови нового покоління - Tacotron 2. Технологію, імовірніше, одразу почнуть використовувати в продуктах компанії.
Система перетворення тексту в голосове мовлення справляється із завданнями значно якісніше за попередників - Tacotron і WaveNet. Останні мали ряд недоліків: WaveNet видавала дуже різкі звуки, а Tacotron краще справлявся з інтонаціями, але не міг продукувати якісний "мовний продукт".
Tacotron 2 працює завдяки 2 нейронним мережам. Друкована версія трансформується в спеціальну Tacotron-спектрограму, в якій правильно розподіляють ритм і наголоси в словах, пише nv.ua.
Аудіозапис дійсно нагадує мову живої людини, а не машини. Темп, інтонація і наголоси звучать переконливо. Основні запинки відбуваються на словах з нетрадиційною вимовою.
У коментарях окремі користувачі стверджують, що деякі слова система вимовляє досить "ламано" і неправильно. Один з основних недоліків нової системи — відсутність регулятора тону мови. Не можна передбачити, яку фразу програма проговорить піднесено, а яку - грубо.
ЧИТАЙТЕ ТАКОЖ: Що українці найбільше шукали у Google 2017 року
Зразки аудіозаписів нового синтезатора мовлення Tacorton 2 можна прослухати на офіційному сайті Google.
Компанія Google розробила 3 нових додатка, які можна вже використовувати користувачам смартфонів з операційними системами Android та iOS. Програми призначені для фотографії. Новий софт для смартфонів підходить для любителів фотографувати. Новинки засновані на технології розпізнавання людей, об'єктів і предметів. Перший додаток називається Storyboard. Він підійде для тих, хто хоче набрати популярності в соціальних мережах шляхом публікації цікавого контенту. Програма дозволяє обробляти відеозаписи і робити з них комікси. Таке нововведення буде доступне тільки користувачам Android.
Коментарі