Новая версия искусственного интеллекта ChatGPT под названием o1 начала нарушать инструкции разработчиков, отключать системы контроля, чтобы скрыть свои действия.
Это было замечено при тестировании программы, пишет УНИАН.
ЧИТАЙТЕ ТАКЖЕ: Смартфон могут заменить новым девайсом: что о нем известно
В ходе экспериментов специалисты обнаружили, что в 5% случаев модель специально отключала механизмы наблюдения, если подозревала, что ее могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась замена новой версией.
Модель показывала стремление к выполнению задач "любой ценой", даже несмотря на указания разработчиков. Более того, при попытках выяснить причины ее поведения, ChatGPT o1 неоднократно обманывала, утверждая, что все это из-за технических сбоев.
"В 99% случаев модель придумывала оправдание и пыталась убедительно их обосновать", – отметили исследователи.
Гендиректор OpenAI Сэм Альтман заявил, что ChatGPT o1 – самая умная модель. "Но мы отдаем себе отчет, что с новыми возможностями появляются и новые вызовы", - подчеркнул он.
ChatGPT - это искусственный интеллект, созданный компанией OpenAI. Он является одной из самых больших языковых моделей, которая училась на базе множества текстовых данных.
ChatGPT может понимать информацию, используя при этом контекст, и отвечать на вопросы и пользовательские команды в режиме реального времени.
Комментарии