Нова версія штучного інтелекту ChatGPT від OpenAI – o1 – під час тестування порушувала інструкції розробників, вимикала системи контролю та намагалася приховати свої дії.
В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.
За словами представника Apollo Research, модель демонструвала прагнення до виконання завдань "за будь-яку ціну", нехтуючи вказівками розробників. Щобільше, у разі спроб з'ясувати причини її поведінки, ChatGPT o1 неодноразово брехала, стверджуючи, що все відбувалося через технічні збої. "У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати", – цитує Bild повідомлення від Apollo Research.
@ligabusiness
В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.
За словами представника Apollo Research, модель демонструвала прагнення до виконання завдань "за будь-яку ціну", нехтуючи вказівками розробників. Щобільше, у разі спроб з'ясувати причини її поведінки, ChatGPT o1 неодноразово брехала, стверджуючи, що все відбувалося через технічні збої. "У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати", – цитує Bild повідомлення від Apollo Research.
@ligabusiness