Модель OpenAI наступного покоління o3 з'явиться на початку 2025 року
OpenAI завершила серію анонсів "12 днів OpenAI" презентацією нової моделі наступного покоління під назвою o3 та її полегшеної версії o3-mini. Про це повідомляє Engadget.
Найважливіші досягнення o3:
- Значно вища продуктивність у порівнянні з попередником: 96,7% правильних відповідей на американському математичному іспиті (o1 мав 83,3%)
- Успішне проходження тесту ARC-AGI, який перевіряє інтуїтивне мислення та здатність до навчання: 75,7% при низьких обчислювальних налаштуваннях і 87,5% при додатковій потужності (перевищує людський рівень у 85%)
- Компанії навіть довелося шукати складніші тести для оцінки моделі через її високу ефективність
o3-mini отримала новий API адаптивного часу мислення з трьома режимами (Низький, Середній, Високий), що дозволяє користувачам регулювати час обробки запитів. При цьому модель досягає результатів рівня o1 з меншими обчислювальними витратами.
o3-mini стане доступною наприкінці січня. o3 спочатку буде доступна лише для дослідників безпеки, публічний запуск — після mini-версії.
OpenAI завершила серію анонсів "12 днів OpenAI" презентацією нової моделі наступного покоління під назвою o3 та її полегшеної версії o3-mini. Про це повідомляє Engadget.
Найважливіші досягнення o3:
- Значно вища продуктивність у порівнянні з попередником: 96,7% правильних відповідей на американському математичному іспиті (o1 мав 83,3%)
- Успішне проходження тесту ARC-AGI, який перевіряє інтуїтивне мислення та здатність до навчання: 75,7% при низьких обчислювальних налаштуваннях і 87,5% при додатковій потужності (перевищує людський рівень у 85%)
- Компанії навіть довелося шукати складніші тести для оцінки моделі через її високу ефективність
o3-mini отримала новий API адаптивного часу мислення з трьома режимами (Низький, Середній, Високий), що дозволяє користувачам регулювати час обробки запитів. При цьому модель досягає результатів рівня o1 з меншими обчислювальними витратами.
o3-mini стане доступною наприкінці січня. o3 спочатку буде доступна лише для дослідників безпеки, публічний запуск — після mini-версії.