您的位置:首页 >要闻 >正文

Stability AI推出首个文本转音频人工智能平台

摘要 Stability AI 是一家总部位于伦敦的生成人工智能公司,最近推出了一个名为Stable Audio的新文本到音频人工智能平台。该平台由人工智能提...

Stability AI 是一家总部位于伦敦的生成人工智能公司,最近推出了一个名为“Stable Audio”的新文本到音频人工智能平台。该平台由人工智能提供支持,代表着该公司首次涉足音乐和声音生成领域。它可以制作长度长达 90 秒的歌曲,适合各种项目,包括广告、有声读物和视频游戏。

该公司一直是人工智能领域的杰出领导者之一。然而,到目前为止,它主要以人工智能生成的视觉效果而闻名。然而,随着其首个文本到音频生成人工智能平台的推出,它与其他行业领导者(包括 OpenAI、Google 和 Meta)展开了直接竞争。

据报道,Stable Audio 平台使用扩散模型,该模型与该公司更受欢迎的图像平台 Stable Diffusion 相同的人工智能模型。然而,在基于文本到音频的稳定音频的情况下,该模型是使用音频数据而不是图像进行训练的。这允许用户生成任意长度的歌曲或背景音频,使其成为适用于各种项目的多功能工具。

此外,稳定音频平台通过进行特定于音乐的训练并合并指定歌曲开始和结束时间的文本元数据,解决了传统音频扩散模型的局限性。这允许用户生成任意长度的歌曲,这对于音乐制作来说是一个很有价值的功能。

以前,音频扩散模型只能生成固定持续时间的音频片段。这限制了他们制作完整歌曲的能力。Stability AI 改进了模型,为 Stable Audio 用户提供更大的灵活性来确定生成歌曲的长度,从而使他们能够更好地控制创作过程。

版权声明:本文由用户上传,如有侵权请联系删除!