🔥 6 новых моделей text2video, которые важно не пропустить1️⃣ LTX-Video — основан на DiT. Генерит видео быстрее, чем вы его потом смотрите
(24 кадра в секунду, разрешение 768x512). Демка тут2️⃣ ILDiff создаёт детализированные анимированные стикеры.
Код берём здесь3️⃣ Open-Sora: text-to-image, text-to-video, image-to-video
. Ролик до 15 секунд, разрешение до 720 и произвольное соотношение сторон.
Есть на GitHub4️⃣ SnapGen-V: видео всего 5 секунд, но зато за 4 шага и сразу на смартфоне
. Смотрите пример с iPhone 16 Pro Max. Всего 6 млн параметров. Плюс
SnapGen для генерации картинок
(1024×1024 за 1,4 секунды)5️⃣ VideoMaker: диффузионка сама
справляется с выделением, извлечением и вводом признаков объектов съёмки для генерации видео zero-shot
6️⃣ RAIN: стрим в реальном времени. Длинный, согласованный видеопоток с низкой задержкой и всего на одной RTX 4090