💻 12/12 | Як і очікувалось, на десерт залишили найсмачніше — показали нову модель o3 і визначились з першим безробітнім в компанії 😅
Фінальний день адвент календаря, Альтман представив o3 та її молодшого брата o3-mini, і тут є від чого напружитись. Сем розказав, що моделька неймовірно розумна і настільки крута в програмуванні, що на Codeforces набрала 2727 очок, обігнавши провідного науковця OpenAI з його жалюгідними 2665 — схоже, комусь в компанії скоро прийдеться оновлювати резюме 😄
Ще модеть вміє довго думати і видавати кращі відповіді (звісно, за більші гроші). А в тесті ARC-AGI (це такий тест на людяність ШІ) модель набрала 87.5%, коли звичайний шкіряний мішок набирає ~85% 🔫
Однак, може, поки й не варто сильно перейматися за свою роботу, бо моделька лише виходить в Public Safety Testing (записатися) та й тільки Сем знає, що у неї на думці та скіки то все буде коштувати.
Познущатися з молодшої моделі обіцяють дати вже в січні 2025-го, там і побачимо хто тут AGI.
➕ СИНТЕТИКА
Фінальний день адвент календаря, Альтман представив o3 та її молодшого брата o3-mini, і тут є від чого напружитись. Сем розказав, що моделька неймовірно розумна і настільки крута в програмуванні, що на Codeforces набрала 2727 очок, обігнавши провідного науковця OpenAI з його жалюгідними 2665 — схоже, комусь в компанії скоро прийдеться оновлювати резюме 😄
Ще модеть вміє довго думати і видавати кращі відповіді (звісно, за більші гроші). А в тесті ARC-AGI (це такий тест на людяність ШІ) модель набрала 87.5%, коли звичайний шкіряний мішок набирає ~85% 🔫
Однак, може, поки й не варто сильно перейматися за свою роботу, бо моделька лише виходить в Public Safety Testing (записатися) та й тільки Сем знає, що у неї на думці та скіки то все буде коштувати.
Познущатися з молодшої моделі обіцяють дати вже в січні 2025-го, там і побачимо хто тут AGI.
➕ СИНТЕТИКА