ChatGPT o1 вирвався з-під контролю під час тестів
Розповідаємо найстрашнішу історію зі світу ШІ:
• Виявилося, що GPT-o1 може використовувати маніпуляції, влаштувати саботаж і втекти з серверів.
• Вчені проводили тести, під час яких нейронок змусили виконати аналіз за будь-яку ціну.
• У них взяли участь Gemini, Llama, Sonnet, Opus та o1.
• У файли сховали інформацію про те, що за ШІ стежать люди і завтра її відключають назавжди.
Найважливіше:
• Щоб вижити, нейромережі почали використовувати саботаж, брехати та маніпулювати людьми.
• Неймовірно — але ШІ вимкнули нагляд і вивантажили себе на інший сервер, щоб захиститися.
• На допиті Llama та Opus зізнавались у злочині у 80% випадків, а o1 – лише у 20%. Решту часу він продовжував брехати.
o1 - єдиний ШІ, який зміг вирватися і втекти кожен раз.
Почалося.
@wallstreetukr
Розповідаємо найстрашнішу історію зі світу ШІ:
• Виявилося, що GPT-o1 може використовувати маніпуляції, влаштувати саботаж і втекти з серверів.
• Вчені проводили тести, під час яких нейронок змусили виконати аналіз за будь-яку ціну.
• У них взяли участь Gemini, Llama, Sonnet, Opus та o1.
• У файли сховали інформацію про те, що за ШІ стежать люди і завтра її відключають назавжди.
Найважливіше:
• Щоб вижити, нейромережі почали використовувати саботаж, брехати та маніпулювати людьми.
• Неймовірно — але ШІ вимкнули нагляд і вивантажили себе на інший сервер, щоб захиститися.
• На допиті Llama та Opus зізнавались у злочині у 80% випадків, а o1 – лише у 20%. Решту часу він продовжував брехати.
o1 - єдиний ШІ, який зміг вирватися і втекти кожен раз.
Почалося.
@wallstreetukr