понеділок, 27 липня 2020 09:43

Штучний інтелект навчили говорити українською

Штучний інтелект навчили говорити українською
Нейромережа генерує українські тексти. Фото: ain.ua

Штучний інтелект вперше навчили говорити українською мовою. Його створили на базі моделі GPT-2, яка дозволяє нейромережі генерувати текст, близький до мови людей.

Мовна модель обирає слова, базуючись на попередніх. Будує логічне дерево послідовностей. Цим займалася технологічна креативна агенція ISD Group, повідомляє ain.ua.

"Розробка інтелекту зайняла півроку: від складення мовного корпусу до шліфовки кінцевого результату. Команда проекту складалася із 8 людей", - розповів засновник та керівник агенції Віктор Шкурба.

Розробники використали українські словники Lang-uk, Brown-uk, ВЕСУМ та ГРАК для створення мовного корпусу. Зібрали 3 гігабайти творів українською з онлайн бібліотек.

Потім генератор GPT-2 доповнили інструментами, які допомагають будувати контекст та коректні послідовності слів в текстах.

"Цього було мало, адже на виході нейромережа "говорила" старомодно. Згодом до мовного корпусу додали субтитри сучасних фільмів, серіалів, блоги, твіти та інший user-generated контент із соціальних мереж. Таким чином інтелект почав говорити сучасно та сленгово", - додав Шкурба.

Пізніше розробники вирішили надати нейромережі характер.

"На другому етапі розробники вирішили піти на експеримент. Не повторювати створення нейтральної системи, штучного порадника, а піти далі і надати йому характеру. Це поганий хлопець, навіть трохи божевільний, який постійно підштовхує своїх друзів на якісь шалені вчинки", - повідомив керівник агенції

Для збору даних залучили молодь через відкриті ігрові телеграм-боти. Користувачі давали відповіді на питання. Після цього через нейромережу кілька разів пропускали вигадані нею ж ідеї. Позначали найбільш вдалі.

ЧИТАЙТЕ ТАКОЖ: Facebook перейшов на українську транслітерацію Kyiv

"Для цього в ISD створили систему похвали і покарань для АІ. Кожен згенерований варіант набирав певний score, що складався з "оцінок" наступних параметрів: ширини контексту, врахування теми попереднього речення, зв'язності та віддаленості від вихідних варіантів датасету. За врахування всіх параметрів, нейромережа отримувала "плюси" — rewards, але за зловживання ними система давала "мінус"— penalties", - розповів Віктор Шкурба.

Нейромережу вдалося змусити виконувати певні дії за шаблонами мовного корпусу та скоригувати генерацію послідовностей у сторону найбільш непередбачуваних та неординарних відповідей.

Випробувати штучний інтелект можна за посиланням.

На сайті президента України створили електронну петицію з вимогою забезпечити можливість перегляду відео на стрімінгових сервісах українською мовою.

Зараз ви читаєте новину «Штучний інтелект навчили говорити українською». Вас також можуть зацікавити свіжі новини України та світу на Gazeta.ua

Коментарі

Залишати коментарі можуть лише зареєстровані користувачі

Голосів: 1
Голосування Як ви облаштовуєте побут в умовах відімкнення електроенергії
  • Придбали додаткове обладнання для оселі задля енергонезалежності
  • Добираємо устаткування та готуємося до купівлі
  • Не маємо коштів на таке, ці прилади надто дорогі
  • Маємо ліхтарі та павербанки для заряджання ґаджетів, нас це влаштовує
  • Певні, що незручності тимчасові і незабаром уряд вирішить проблему браку електроенергії
  • Наша оселя зі світлом, бо ми на одній лінії з об'єктом критичної інфраструктури
  • Ваш варіант
Переглянути