Stable Audio 在线体验及部署经验

最新推荐文章于 2025-04-16 20:25:31 发布

旭_1994

最新推荐文章于 2025-04-16 20:25:31 发布

阅读量2.7k

点赞数 20

文章标签：人工智能 python 音频

本文链接：https://blog.csdn.net/qq_38944169/article/details/139576341

版权

本文主要介绍使用virtualenv库生成venv，进而部署/运行Stable-Audio-Open-1.0文生音频模型的方法。

1. 在线体验

本文代码已部署到百度飞桨AI Studio平台，以供大家在线体验。

项目链接：Stable Audio 在线体验

注意：Stable-Audio-Open-1.0 （默认fp32模式）显存峰值占用接近15GB。

2. 环境部署

python版本：3.10.10
virtualenv环境部署代码如下：

git clone https://github.com/Stability-AI/stable-audio-tools.git

cd stable-audio-tools

pip install -U virtualenv

python -m virtualenv venv

source venv/bin/activate

pip install stable_audio_tools

安装stable_audio_tools库会自动安装以下依赖库：

aeiou==0.0.20
alias-free-torch==0.0.6
auraloss==0.4.0
descript-audio-codec==1.0.0
einops==0.7.0
einops-exts==0.0.4
ema-pytorch==0.2.3
encodec==0.1.1
gradio>=3.42.0
huggingface_hub
importlib-resources==5.12.0
k-diffusion==0.1.1
laion-clap==1.1.4
local-attention==1.8.6
pandas==2.0.2
pedalboard==0.7.4
prefigure==0.0.9
pytorch_lightning==2.1.0 
PyWavelets==1.4.1
safetensors
sentencepiece==0.1.99
s3fs
torch>=2.0.1
torchaudio>=2.0.2
torchmetrics==0.11.4
tqdm
transformers
v-diffusion-pytorch==0.0.2
vector-quantize-pytorch==1.9.14
wandb==0.15.4
webdataset==0.2.48
x-transformers<1.27.0

3. 模型下载

原始链接：https://huggingface.co/stabilityai/stable-audio-open-1.0

镜像链接：https://hf-mirror.com/stabilityai/stable-audio-open-1.0 （需登录下载）

镜像链接：https://hf-mirror.com/audo/stable-audio-open-1.0 （可直接下载）

这里采用wget下载模型文件（4.5GB），下载代码：

mkdir stable-audio-open-1.0

cd stable-audio-open-1.0

wget https://hf-mirror.com/audo/stable-audio-open-1.0/resolve/main/LICENSE
wget https://hf-mirror.com/audo/stable-audio-open-1.0/resolve/main/model.safetensors
wget https://hf-mirror.com/audo/stable-audio-open-1.0/resolve/main/model_config.json
wget https://hf-mirror.com/audo/stable-audio-open-1.0/resolve/main/README.md

4. 运行

Stable-Audio-Open-1.0的运行很简单，激活虚拟环境后运行 stable-audio-tools/run_gradio.py 文件即可（可以通过 --model-config /path/to/model/config --ckpt-path /path/to/wrapped/ckpt 从自定义路径加载 model_config.json 和 model.safetensors 文件）。

代码如下：

cd stable-audio-tools

source venv/bin/activate

python run_gradio.py --model-config stable-audio-open-1.0/model_config.json --ckpt-path stable-audio-open-1.0/model.safetensors