以下是本地部署AI生成音乐工具的详细步骤,综合了多款主流工具(包括MusicGPT、audiocraft_plus、YuE等)的部署方案,可根据硬件条件和需求选择适合的方案:
一、基础环境准备
系统要求
Windows 10/11(推荐专业版)、macOS 10.15+ 或 Linux Ubuntu 20.04+
存储空间:至少预留10GB(模型文件通常较大)
硬件建议
CPU:Intel i5 或同等性能以上
显卡:NVIDIA GPU(显存≥8GB,支持CUDA加速更佳)
依赖安装
安装Python 3.10+、Git、FFmpeg
推荐使用Anaconda管理虚拟环境(针对audiocraft等复杂工具)
二、主流工具部署方案
方案1:MusicGPT(适合新手,开箱即用)
下载程序
访问GitHub仓库 gabotechs/MusicGPT ,下载对应系统的压缩包。
解压运行
Windows用户解压后双击musicgpt.exe ,自动下载模型到C盘(需预留2GB空间)。
访问界面
启动后浏览器自动打开localhost:8642,输入提示词即可生成音乐(支持中英文)。
方案2:audiocraft_plus(支持自定义模型,高阶用户)
克隆仓库
git clone https://github.com/GrandaddyShmax/audiocraft_plus
cd audiocraft_plus
安装依赖
conda create -n audiocraft python=3.10
conda activate audiocraft
pip install -r requirements.txt
解决常见错误
若报错No module named ‘triton’,需手动安装:
pip install triton==2.1.0
方案3:YuE(歌词生成完整歌曲,支持中文)
下载模型
从开源社区获取预训练模型(如Hugging Face平台)。
本地部署
git clone https://github.com/YuE-Music/YuE
pip install -r requirements.txt
python app.py --model_path ./models/yue_base
生成歌曲
输入歌词文本,通过API或Web界面生成最长5分钟的歌曲。
三、高级配置与优化
GPU加速
安装CUDA 11.7+和cuDNN 8.5+,在启动命令中添加--cuda参数。
内网穿透(远程访问)
使用cpolar工具创建隧道,将本地端口(如8642)映射为公网域名:
cpolar http 8642 -region=china
模型管理
替换模型文件路径(如audiocraft支持MusicGen、AudioGen等模型)。
四、注意事项
生成效果优化
英文提示词比中文效果更稳定,可用ChatGPT翻译优化。
调整生成时长(10-30秒),过长可能导致内存溢出。
资源监控
使用nvidia-smi监控GPU显存占用,避免超过80%。
以上方案可根据需求选择,新手推荐从MusicGPT开始,开发者或需要定制化功能可选择audiocraft_plus或YuE。更多细节可参考各工具的官方文档。