OpenAI завершила свой 12-дневный марафон анонсов презентацией o3 — нового семейства "рассуждающих" моделей, преемника o1. Интересно, что компания пропустила название o2 из-за возможного конфликта с британским телекоммуникационным провайдером O2. Впрочем, символики тут все равно достаточно — вместо кислорода мы имеем озон, который до сих пор ассоциируется со свежестью.
Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.
Главная особенность o3 — способность к "самопроверке" через "внутреннюю цепочку рассуждений". Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на "размышления" — чем больше времени, тем точнее результат.
По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.
Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.
https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/
Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.
Главная особенность o3 — способность к "самопроверке" через "внутреннюю цепочку рассуждений". Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на "размышления" — чем больше времени, тем точнее результат.
По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.
Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.
https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/