ChatGPT o1 неоднократно обманывала своих разработчиков

ChatGPT научился обманывать своих разработчиков

Новая версия искусственного интеллекта ChatGPT под названием o1 начала нарушать инструкции разработчиков, отключать системы контроля, чтобы скрыть свои действия.

Это было замечено при тестировании программы, пишет УНИАН.

В ходе экспериментов специалисты обнаружили, что в 5% случаев модель специально отключала механизмы наблюдения, если подозревала, что ее могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, где обсуждалась замена новой версией.

Модель показывала стремление к выполнению задач "любой ценой", даже несмотря на указания разработчиков. Более того, при попытках выяснить причины ее поведения, ChatGPT o1 неоднократно обманывала, утверждая, что все это из-за технических сбоев.

"В 99% случаев модель придумывала оправдание и пыталась убедительно их обосновать", – отметили исследователи.

Гендиректор OpenAI Сэм Альтман заявил, что ChatGPT o1 – самая умная модель. "Но мы отдаем себе отчет, что с новыми возможностями появляются и новые вызовы", - подчеркнул он.

ChatGPT - это искусственный интеллект, созданный компанией OpenAI. Он является одной из самых больших языковых моделей, которая училась на базе множества текстовых данных.

ChatGPT может понимать информацию, используя при этом контекст, и отвечать на вопросы и пользовательские команды в режиме реального времени.

Если вы заметили ошибку в тексте, выделите ее мышкой и нажмите комбинацию клавиш Alt+A

Комментировать

ChatGPT научился обманывать своих разработчиков

Комментарии