Stable Diffusion Creator将视频添加到其生成式AI模型中
•
2023-12-01 14:34:41
摘要 StabilityAI 是稳定扩散人工智能图像生成器 背后的公司,已将视频添加到其剧本中。新模型建立在现有图像工具之上,用户只需按一下按钮即...
StabilityAI 是稳定扩散人工智能图像生成器 背后的公司,已将视频添加到其剧本中。
新模型建立在现有图像工具之上,用户只需按一下按钮即可将任何图像转换为视频。目前,它只是一个研究预览版,不能用于商业用途,但 StabilityAI 表示,这个早期版本非常适合业余爱好者和教育目的。
它能做什么?
与Runway视频生成工具的早期版本一样,稳定视频扩散 (SVD) 是图像到视频,因此您需要一个起始图像来开始工作。Runway还具有文本转视频功能,Meta 的新Emu Video发布后也将具有该功能。SVD 在包含数百万个视频的数据集上进行训练,然后针对较小的标记剪辑选择进行微调以提高准确性。训练数据的来源很可能是公共研究视频库,这也解释了非商业许可的原因。
演示视频似乎表明它能够以高清分辨率制作接近但不完美的逼真短视频剪辑。研究论文称,它每秒可以生成 25 帧,分辨率为 576 x 1024。
它真像听起来那么好吗?
该版本也有一些限制。它最初只能制作四秒的剪辑,尽管这与《跑道》相同。
据 StabilityAI 称,这种新模型无法根据文本提示生成视频剪辑。它仅在以图像作为起点时才有效。它更大的问题来自于你可能想要如何使用它。例如,它可能会产生非常慢的摄像机平移或根本没有运动。
不过,它将来可能会进行调整,以提供视频中某个对象的 360 度视图,从而实现完全平移。该公司还在开发文本到视频的版本,允许用户从简单的文本行创建视频。
目标可能是将该模型授权给公司,以便将其包含在其他产品中,例如视频编辑器、广告工具,甚至教师教育,以创建更多互动课程。
版权声明:本文由用户上传,如有侵权请联系删除!
标签: