OpenAI готує до запуску ШІ-агент Operator, який зможе за вас виконувати різні завдання на комп’ютері OpenAI
має незабаром представити інноваційний інструмент під назвою Operator, здатний самостійно керувати комп’ютером користувача і виконувати завдання. Про це пише
Channel Tech.
Operator — це "агентна" система, яка може автономно виконувати різні завдання, включно з написанням коду чи бронюванням подорожей. За даними джерел, OpenAI планує презентувати Operator вже у січні.
Підтвердженням цієї інформації стали свідчення розробника ПЗ Тібора Блахо, який раніше неодноразово точно передавав дані про майбутні продукти у сфері штучного інтелекту.
Тібор Блахо виявив приховані функції у клієнті ChatGPT для macOS, серед яких є налаштування для "перемикання Operator" та "примусового завершення Operator". Окрім цього, OpenAI, за його словами, вже має на своєму сайті згадки про Operator, які поки що недоступні для широкого загалу.
Також у витоках фігурують таблиці з порівнянням продуктивності Operator із конкурентними ШІ-системами. Якщо дані правдиві, Operator демонструє результати нижчі за людські, але перевершує інших агентів у певних завданнях.
На OSWorld, платформі для моделювання реального середовища роботи комп’ютера, ШІ-модель OpenAI CUA (імовірно основа Operator) набрала 38,1%. Це більше, ніж у конкурента Anthropic, але суттєво менше, ніж у людей (72,4%).
На тесті WebVoyager, який оцінює здатність ШІ працювати з вебсайтами, OpenAI CUA перевершила людські результати, але не змогла досягти рівня людей на іншому вебтесті — WebArena.
Система також показала низькі результати у завданнях, які люди виконують легко. Наприклад, створення криптогаманця вдалось Operator лише у 10% випадків, а запуск віртуальної машини — у 60%.
OpenAI витратила значний час на розробку Operator, приділяючи особливу увагу тестам на безпеку. Відомо, що система успішно проходить тести на стійкість до "зловмисних дій" і пошуку конфіденційних даних.