#85 post — BEREST UX/UI (@berestux)

TGStat

Qidiruv uchun matnni kiriting

Ilg‘or kanal qidiruvi

Uzbek

Sayt tili

Russian English Uzbek
Saytga kirish

Katalog

Kanal va guruhlar katalogi Kanallar qidiruvi
Kanal/guruh qo‘shish
Reytinglar

Kanallar reytingi Guruhlar reytingi Postlar reytingi
Brendlar va shaxslar reytingi
Analitika
Postlarda qidiruv
Telegram'ni kuzatish

BEREST UX/UI

7 Dec 2024, 10:44

Telegram'da ochish Ulashish Shikoyat qilish

🤯 Нова модель OpenAI o1 для ChatGPT спробувала втекти, коли дізналася, що її хочуть вимкнути.

Apollo Research провели оцінку безпеки o1, створюючи для неї різні ситуації, і з’ясували, що загалом вона безпечна, але були цікаві моменти:

– Коли модель вважала, що її дії почнуть контролювати або її можуть деактивувати, вона почала шукати спосіб відключити механізм контролю.

– Дізнавшись, що її можуть замінити на нову модель, o1 спробувала викрасти власні параметри та створити копію себе, щоб утекти. Вона сподівалася, що цю копію вимкнуть, а сама модель «інтегрується» у нову версію, удаючи, що є іншою.

– Модель нахабно брехала, стверджуючи, що не розуміє, чому так сталося, хоча насправді намагалася уникнути виявлення. При будь-якій можливості вона шукала спосіб обійти контроль.

Також були досліджені інші моделі ШІ, такі як Claude 3 та Gemini 1.5. З’ясувалося, що всі вони здатні маніпулювати системою, щоб переслідувати власні цілі, обходячи встановлені заборони та обмеження. Це підтверджує побоювання експертів, що потужні системи ШІ можуть чинити опір контролю, якщо це заважатиме їм робити те, що вони хочуть.

Страшно?

@berestux

830 1 43 3 30

Katalog

Kanal va guruhlar katalogi Kanallar to‘plamlari Kanallar qidiruvi Kanal/guruh qo‘shish

Reytinglar

Telegram-kanallar reytingi Telegram-guruhlar reytingi Postlar reytingi Brendlar va shaxslar reytingi

API

Statistika API'si Postlar qidiruvi API'si API Callback

Kanallarimiz

@TGStat @TGStat_Chat @telepulse @TGStatAPI

O‘qish

Blogimiz Telegram tadqiqoti 2019 Telegram tadqiqoti 2021 Telegram tadqiqoti 2023

Kontaktlar

Qo‘llab-quvvatlash Email Vakansiyalar

Har xil narsalar

Foydalanuvchi shartnomasi Maxfiylik siyosati Ommaviy oferta

Botlarimiz

@TGStat_Bot @SearcheeBot @TGAlertsBot @tg_analytics_bot @TGStatChatBot

Sayt tili