Stability AI最近发布了一个用于生成声音和歌曲的开放人工智能模型——Stable Audio Open,今天带大家一起了解一下!
模型介绍
Stable Audio Open 是一个专为使用文本提示生成短音频样本、音效和制作元素而优化的开源模型。此外,该模型还具备音频变化和风格转换的功能,使得用户可以根据个人喜好或项目需求调整音频的风格和特点。
根据Stability AI 介绍,Stable Audio Open使用了486,492个录音训练数据,其中 472,618 个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling+获得了商业许可。
与 Stability AI 的商业 Stable Audio 产品不同,Stable Audio 可生成长达 3 分钟的更长、连贯的音乐曲目,而 Stable Audio Open 专注于使用文本提示生成长达 47 秒的高质量音频数据。
使用地址
· 开源地址:
https://huggingface.co/stabilityai/stable-audio-open-1.0
· 在线demo:
https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero
Stable Audio Open目前只能用于学术研究,还无法商业化。
*西安觉醒元宇宙AI,是专注线上AI培训、AI绘画辅导、AI开发服务的专业教育平台!