🤖Анонс від OpenAI: день 12 із 12. Показали нові o3 і o3-mini моделі (o2 вже зайнятий бренд)
• o3 працює на рівні доктора наук і іноді навіть краще в різних бенчмарках
• o3 пройшла ARC-бенчмарк на 87.5%, складний бенчмарк, на якому тестують потенційні AGI, там багато запитань і деякі схожі на IQ-тести або на загадки; люди в цьому тесті набирають ~85%, минулий найкращий результат був ~50%. Тобто ARC-бенчмарк - пал.
• o3 працює так само, як і o1, у різних режимах: довше думає, краща відповідь, але при цьому й дорожче. Користувач може вибрати один із «розумових» пресетів сам.
• Моделі поки випустили в Public Safety Tests, тобто вчені зможуть допомогти їх тестувати, а ми не зможемо допомогти їх ламати.
➡️Запроси друга до Neirom🇺🇦
• o3 працює на рівні доктора наук і іноді навіть краще в різних бенчмарках
• o3 пройшла ARC-бенчмарк на 87.5%, складний бенчмарк, на якому тестують потенційні AGI, там багато запитань і деякі схожі на IQ-тести або на загадки; люди в цьому тесті набирають ~85%, минулий найкращий результат був ~50%. Тобто ARC-бенчмарк - пал.
• o3 працює так само, як і o1, у різних режимах: довше думає, краща відповідь, але при цьому й дорожче. Користувач може вибрати один із «розумових» пресетів сам.
• Моделі поки випустили в Public Safety Tests, тобто вчені зможуть допомогти їх тестувати, а ми не зможемо допомогти їх ламати.
➡️Запроси друга до Neirom🇺🇦