Мишин Лернинг 🇺🇦🇮🇱


Kanal geosi va tili: Ukraina, Ruscha


Субъективный канал об искусстве машинного обучения, нейронных сетях и новостях из мира искусственного интеллекта.

Связанные каналы  |  Похожие каналы

Kanal geosi va tili
Ukraina, Ruscha
Statistika
Postlar filtri


Трансляция GPT-4.5

Pro — скоро
Plus юзеры — следующая неделя

Основная мысль: очень много претрейна (на нескольких датацентрах), что дало возможность получить лучшую unsupervised модель, они уже прогнали supervised-fine-tune и rlfh, получив отличные результаты базовой нон-ризонинг модели, и намекнули, что потенциальная новая ризонинг модель на базе GPT-4.5 может быть еще лучше, что логично.

https://www.youtube.com/live/cfRYp0nItZ8?si=QdHB5-bcFJd7KLq3


📄 Вышла системная карточка GPT-4.5

https://cdn.openai.com/gpt-4-5-system-card.pdf

Если коротко, лучше 4o, хуже o3-mini


🤯 Я сейчас не шучу, Дональд Трамп сгенерировал видео и выложил на своей платформе Truth Social. Какая же это дичь..

https://truthsocial.com/@realDonaldTrump/posts/114068387897265338

3.5k 4 162 18 115

✳️ Claude 3.7 Sonnet доступна всем!

Anthropic представили Claude 3.7 Sonnet (лучшую на этой неделе) LLM в их линейке, обладающий гибридным режимом рассуждения. Это означает, что модель может выдавать мгновенные ответы или работать в расширенном reasoning-режиме.

🖥 Claude Code – интеллектуальный агент для разработки

Anthropic также представили Claude Code – инструмент для автоматизации программирования прямо из командной строки. Он умеет:
🔹 Анализировать код и редактировать файлы
🔹 Запускать тесты и отлаживать программы
🔹 Автоматически коммитить и пушить изменения в GitHub
🔹 Использовать командную строку для выполнения сложных задач

Результаты раннего тестирования показывают, что Claude Code сокращает время на выполнение сложных задач с 45 минут до одного запроса (прям так и пишут, ок, цитирую).

Но самое крутое то, что модель доступна всем, даже бесплатным пользователям!

💻 Го тестить: https://claude.ai/


Deep Research от OpenAI

Автоматизация исследования. Наверняка помнишь себя, гуглящую, сидящую на форумах, пересматривающую видео в поисках ответа. Благодаря Deep Research можно делегировать это GPT.

По сути это эволюция медленного мышления (chain-of-thought), которое мы наблюдали в o1 и о3 с тюном (o3 fine-tune) в строну работы с поисковиком и экстракции и обработки найденой информации.



Трансляция началась:
https://youtu.be/jv-lpIsnLOo


2 нейронки от китайского режима подряд

Сначала deepseek, теперь qwen2.5-max. Холодная ии война


OpenAI запускают агента Operator

Упрощает рутину: от бронирования столика или покупки билетов в браузере до более сложного ассистирования.

🖥️ https://www.youtube.com/live/CSE77wAdDLg?si=-ZZQJ-zCByXW3NIB

5.5k 1 33 12 27



З Новим роком! שנה טובה С Новым годом! 🎄

6.1k 1 11 28 170

Microsoft AI представили Phi-4 — Small Language Model 14 млрд

Так, результаты сопоставимы с гораздо более крупными моделями, такими как GPT-4 и Llama-3.

Ключевые особенности Phi-4:
Synthetic Data Generation: Используются подходы вроде chain-of-thought prompting для создания данных, стимулирующих системное мышление, завещание у нотариуса, кофе душистый
Post-Training Refinement: Direct Preference Optimization и rejection sampling для улучшения логической согласованности и точности ответов.
Extended Context Length: Увеличенная длина контекста до 16K токенов для сложных задач с длинными цепочками рассуждений.

Результаты:
GPQA: 56.1 (лучше GPT-4o с 40.9 и Llama-3 с 49.1).
MATH: 80.4

📝 Phi-4 Технический Репорт


Denis Sexy IT 🤖 dan repost
Video oldindan ko‘rish uchun mavjud emas
Telegram'da ko‘rish
По Sora утекло новое видео, говорят показывают v2

* 1-минутные видео на выходе
* текст в видео
* текст+изображение в видео
* текст+видео в видео

Не долго мы жили без cam-rip в АИ видео ☕️

5k 0 29 1 41

✨ Стрим от OpenAI, День 2

Напоминаю, что вчера открыли доступ к полноценной o1, и представили новую pro подписку. Что было:

— Файнтюн o1 модели (позволяют обучать типу рассуждений, что полезно в узкоспециализированных доменах: право, генетика, etc)

👉 https://youtu.be/fMJMhBFa_Gc




🔍 OpenAI выкатили ChatGPT Search

подробнее тут


Video oldindan ko‘rish uchun mavjud emas
Telegram'da ko‘rish
📍 CoTracker3 — новый подход к трекингу точек

Модель команды Meta AI и Visual Geometry Group из Оксфорда обучали на реальных видео без аннотаций, используя псевдоразметку.

Особенности CoTracker3:
— Обучение на реальных видео в semi-supervised-режиме.
— Упрощённая архитектура требует 1000 раз меньший датасет без потери качества.
— Поддержка трекинга через окклюзии с другими объектами.

Результаты:
Модель значительно превосходит предыдущие трекеры (например, BootsTAPIR и LocoTrack) в задачах с обширной окклюзией и более стабильна. CoTracker3 демонстрирует высокую точность на стандартных бенчмарках. Из ограничений выделю трудности с трекингом на поверхностях без характерных особенностей, таких как небо или вода.

📄 paper
🤗 demo
💻 code


Состоялся релиз Stable Diffusion 3.5 8B Large

https://huggingface.co/stabilityai/stable-diffusion-3.5-large


Новая диффузионная модель от Nvidia: Sana

Основные особенности:

— DC-AE энкрдер, (если интересно вот ссылка) который понижает в 32 раза, вместо привычных 8ми для vqVAE, без сильных потерь

— Линейный DiT: по сути ViT, где фьюз происходит не через аттеншен, а через марицу рангом d


🔥 Сегодня Mistral AI представила новые модели — Ministral 3B и Ministral 8B

Ministral 3B и Ministral 8B, разработанные для on-device вычислений. Эти модели предлагают превосходную производительность в задачах reasoning, commonsense и function-calling, поддерживая контекст до 128k токенов.

⚙️ Ministral 3B разработана для сверхэффективного использования на устройствах с ограниченными ресурсами (e.g.: смартфоны). Ministral 8B предлагает больше возможностей для сложных задач. Обе модели поддерживают до 128k контекста и используют передовые методы pruning и quantization для снижения нагрузки на железо.

Бенчмарки показывают неплохой буст в сравнение с существующими Llama 3.1 / 3.2 и Gemma 2 моделями.


🤖 Ministral 8B: ссылка на модель


🎓 Уже вторая Нобелевская премия за AI — на этот раз по химии. Половина премии за предсказание структуры белков» нейросетью Alpha Fold (от DeepMind)

Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».


🎓 Хинтон и Хопфилд получили Нобелевскую премию по физике за создание искусственных нейронных сетей

Нобелевскую премию по физике 2024 года Джону Дж. Хопфилду и Джеффри Э. Хинтону «за основополагающие открытия и изобретения, которые позволяют осуществлять машинное обучение с использованием искусственных нейронных сетей».

20 ta oxirgi post ko‘rsatilgan.