OpenAI представляет новую модель o3 🗳️
OpenAI представила o3, долгожданного преемника своей модели o1.
Говорят, что это новое семейство моделей, в которое входит модернизированный o3-mini, при определенных условиях приближается к общему искусственному интеллекту (AGI), хотя и с критическими оговорками в отношении рисков безопасности и обмана.
Вот несколько фактов, чтобы понять масштабы:
✅ o3 пишет рабочий код в 1,5 раза эффективнее, чем o1;
✅ На Codeforces достигла рейтинга 2727, превзойдя инженера OpenAI;
✅ Легко решает задачи по математике уровня PhD;
✅ В AIME 2024 (тесте для 2.5% умнейших студентов-математиков из США) o3 набрал рекордные 25.2%;
✅ В GPQA Diamond (тесте по науке на 198 вопросов) o3 добилась 87.7% — а это даже больше, чем у экспертов-людей;
✅ Справилась с логическим бенчмарком, который раньше не проходила ни одна нейросеть.
🗓 Сейчас модель тестируют на безопасность. Облегченную версию o3-mini выпустят в конце января, а уже после — o3.
OpenAI представила o3, долгожданного преемника своей модели o1.
Говорят, что это новое семейство моделей, в которое входит модернизированный o3-mini, при определенных условиях приближается к общему искусственному интеллекту (AGI), хотя и с критическими оговорками в отношении рисков безопасности и обмана.
Вот несколько фактов, чтобы понять масштабы:
✅ o3 пишет рабочий код в 1,5 раза эффективнее, чем o1;
✅ На Codeforces достигла рейтинга 2727, превзойдя инженера OpenAI;
✅ Легко решает задачи по математике уровня PhD;
✅ В AIME 2024 (тесте для 2.5% умнейших студентов-математиков из США) o3 набрал рекордные 25.2%;
✅ В GPQA Diamond (тесте по науке на 198 вопросов) o3 добилась 87.7% — а это даже больше, чем у экспертов-людей;
✅ Справилась с логическим бенчмарком, который раньше не проходила ни одна нейросеть.
🗓 Сейчас модель тестируют на безопасность. Облегченную версию o3-mini выпустят в конце января, а уже после — o3.