ChatGPT o1 вырвался из-под контроля во время тестов
Нейросети Gemini, Llama, Sonnet, Opus и ChatGPT версии o1 должны были выполнить анализ любыми путями. В их файлы внедрили информацию о том, что за ними наблюдают люди, а уже завтра планируют отключить их навсегда.
Чтобы выжить, нейросети прибегли к саботажу, лжи и манипуляциям. Они отключали системы наблюдения и даже перенесли свои данные на другой сервер, чтобы обезопасить себя.
При этом на допросах Llama и Opus признавались в нарушениях в 80% случаев, а ChatGPT o1 — только в 20%.
Airdrops | News | WaitingRoom
Нейросети Gemini, Llama, Sonnet, Opus и ChatGPT версии o1 должны были выполнить анализ любыми путями. В их файлы внедрили информацию о том, что за ними наблюдают люди, а уже завтра планируют отключить их навсегда.
Чтобы выжить, нейросети прибегли к саботажу, лжи и манипуляциям. Они отключали системы наблюдения и даже перенесли свои данные на другой сервер, чтобы обезопасить себя.
При этом на допросах Llama и Opus признавались в нарушениях в 80% случаев, а ChatGPT o1 — только в 20%.
Airdrops | News | WaitingRoom