Stable Diffusion创建者正在测试AI驱动的视频生成器

编辑： • 来源： • 2023-12-14 10:57:34

StableDiffusion 的创建者 Stability AI 宣布，用户现在可以测试一种新的生成人工智能，该人工智能可以对根据文本提示生成的单个图像进行动画处理，以创建人工智能生成的视频。

Stability AI 表示：“Stable Video Diffusion 以两种图像到视频模型的形式发布，能够以每秒 3 至 30 帧的可定制帧速率生成 14 和 25 帧。”

视频以 1,024 x 576 分辨率生成。

该公司表示：“这种最先进的生成人工智能视频模型代表了我们为各种类型的每个人创建模型的旅程中迈出的重要一步。”

“通过插入时间层并在小型高质量视频数据集上对其进行微调，为 2D 图像合成训练的潜在扩散模型已转变为生成视频模型。”

Stability AI对其新的人工智能视频生成器进行了用户偏好研究，并表示受到了好评。

“在以基础形式发布时，通过外部评估，我们发现这些模型在用户偏好研究中超越了领先的封闭模型，”它说。

作为参考，用户偏好研究将 Stable Video Diffusion 与 Runway 和 Pika Labs 等文本转视频平台进行了比较。

人工智能视频生成器目前仅用于研究目的，潜在用户可以加入候补名单以访问“即将推出的具有文本到视频界面的网络体验”。

Stable Diffusion 指出生成式 AI 有一些局限性，包括：

生成的视频相当短(最多 4 秒)。

该模型缺乏完美的真实感。

除了缓慢的摄像机平移之外，该模型无法进行摄像机运动。

模型无法通过文本控制。

该模型无法呈现清晰的文本。

一般情况下，面孔和人物可能无法正确生成。

模型的自动编码部分是有损的。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：