Stability AI представила Stable Video Diffusion — модель для генерации коротких видеороликов.
Модель генерирует видеоролики продолжительностью до четырех секунд по изображению или текстовому описанию.
У Stable Video Diffusion есть две версии:
SVD генерирует ролики с частотой 14 кадров в секунду;
SVD-XT использует ту же архитектуру, что и SVD, но увеличивает количество кадров в сгенерированных видеороликах до 24 в секунду.
Как утверждает Stability AI, модель Stable Video Diffusion по качеству генерации показывает себя лучше моделей Runway GEN-2 и Pika Labs.
Компания разместила исходный код и веса Stable Video Diffusion в открытом доступе. Найти их можно на GitHub (
https://github.com/S…ive-models) и Hugging Face. (
https://huggingface.…img2vid-xt)