MockingBird,手把手教你克隆您的声音,AI代言人,惊艳你的耳朵!

MockingBird为github开源项目,项目地址:https://github.com/babysor/MockingBird

操作步骤中所有使用的软件安装包已上传网盘,可以关注公众号【站在前沿】,回复voice,获取网盘下载链接,也可以自行下载。

1、安装python3.8版本及以上

https://www.python.org/downloads/windows/

2、安装 PyTorch, 直接官网下载 Start Locally | PyTorch

如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。使用管理员CMD运行命令。如CPU命令:pip3 install torch torchvision torchaudio

3、安装 ffmpeg ,Download FFmpeg,下载后解压,然后进入bin目录,拷贝路径添加到系统环镜变量,使用CMD测试一下。

4、下载开源项目,GitHub - babysor/MockingBird: 🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time,下载后解压。

5、进入源码目录,在地址栏里输入CMD,确认当前路径是解压后的源码目录,使用下列命令安装必备程序包

python -m pip install --upgrade pip
pip install -r requirements.txt
pip install webrtcvad-wheels

运行第二行命令时间比较长,一般会报错,需要安装C++编译环境,下载社区版就可以,下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux,再运行第二行命令

6、下载语言模型,下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建文件夹。

7、执行下列运行命令,启动Web程序

python web.py

8、下载训练数据集

由于训练数据集比较大,上传到的谷歌网盘,需要安全上网后下载,下载地址:https://drive.google.com/u/0/uc?id=110A11KZoVe7vy6kXlLb6zVPLb_J91I_t&export=download

9、也可以启动工具箱程序,数据集路径为 C:\data\aidatatang_200zh,那么 <datasets_root>就是 C:\data

python demo_toolbox.py -vc -d F:\data

所有使用的软件安装包已上传网盘,可以关注公众号【站在前沿】,回复voice,获取网盘下载链接,也可以自行下载。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值