初尝 Mocking Bird 语音合成

Mocking Bird 是一个实时语音克隆项目,可在 5 秒内克隆声音并生成任意语音内容。

官方安装环境教程

运行工具箱(demo_toolbox.py)需要 Python 3.7 或更高版本。

  • 安装 PyTorch
    • 如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功
  • 安装 ffmpeg
  • 运行 pip install -r requirements.txt 来安装剩余的必要包。
  • 安装 webrtcvad pip install webrtcvad-wheels

或者

  • conda 或者 mamba 安装依赖

    conda env create -n env_name -f env.yml

    mamba env create -n env_name -f env.yml

    会创建新环境安装必须的依赖. 之后用 conda activate env_name 切换环境就完成了.

    • env.yml只包含了运行时必要的依赖,暂时不包括monotonic-align,如果想要装GPU版本的pytorch可以查看官网教程。

安装步骤

安装Python

按照官方给出的教程进行安装,首先是安装Python3,这里装的是Python3.9.13。选用镜像网站下载Python3安装包。在网站中找到python-3.9.13-amd64.exe,点击下载。
下载Python安装包
Python3.9.13安装的步骤如下,安装位置在哪里都行,方便寻找这里安装在D盘。
安装Python
安装Python
安装Python
安装Python
安装Python

安装CUDA

进入PyTorch官网,选用GPU,如果GPU不支持选用CPU方式安装。
PyTorch选择
这里显示的是CUDA11.8,进入CUDA官网下载,根据电脑配置选择,安装类型选local
下载CUDA

CUDA安装如下

安装CUDA
安装CUDA
安装CUDA
安装CUDA
安装CUDA
安装CUDA
安装CUDA

安装PyTorch

选一个剩余空间多的盘,创建MockingBird文件夹,进入这个文件夹,按住键盘上的Shift键的同时按下鼠标的右键,选在此处打开Powershell窗口,在里面输入python -m venv venv来实现创建虚拟环境,防止影响其他Python项目。
创建Python虚拟环境
输入.venv\Scripts\pip3 -V回车得到类似下面的输出那么虚拟环境搭建成功。
检测Python虚拟环境
输入.\venv\Scripts\python -m pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118进行安装PyTorch
安装PyTorch
安装PyTorch中
pip安装pytorch完成

安装ffmpeg

打开ffmpeg网址ffmpeg-master-latest-win64-gpl.zip下载。
ffmpeg下载
将下载得到的zip包解压,并将其中的文件夹放入D盘的Program Files文件夹内。
放置ffmpeg文件夹
这时候ffmpeg还没完全安装结束,还需要设置环境变量,打开win10设置。
win10设置
找到win10设置中的关于打开高级系统设置
win10设置关于
找到系统属性中的环境变量
系统属性
选中Path,点击编辑
环境变量
新建环境变量,这里ffmpeg放在了D盘的Program Files中,路径为D:\Program Files\ffmpeg-master-latest-win64-gpl,将ffmpeg文件夹中bin文件夹的路径输入环境变量中,最后全部一路点确定
ffmpge环境变量
检测ffmpeg环境变量是否设置成功,打开新的Powershell窗口,输入ffmpeg -version,如有以下输出,则说明ffmpeg的环境变量没问题。
检测ffmpeg环境变量

安装剩余的包

此时项目源码还没下载,打开项目开源地址MockingBird下载源代码。
下载项目源码
下载好的是zip包,解压后将里面的源代码复制到一开始创建的MockingBird文件夹里。
复制源码
在该目录下打开PowerShell窗口,输入.\venv\Scripts\python -m pip install -r requirements.txt
安装剩余的包
这时候报错了,ERROR: No matching distribution found for monotonic-align==0.0.3
报错-1
解决办法是打开目录下的requirements.txt文件,将==0.0.3删掉,然后再次执行.\venv\Scripts\python -m pip install -r requirements.txt安装剩余的包。
修复-1
不出意外又要出意外,第二个报错出现了,ERROR: Failed building wheel for monotonic- align,再往下看报错信息,是缺少了C++编译环境导致无法编译成功。
报错-2
解决办法是安装相应的环境,这里直接安装Visual Studio来修复。打开Visual Studio官网下载社区版就行了,下完后就进行安装,步骤如下。
Visual Studio安装
Visual Studio安装
将安装位置改为D盘。
Visual Studio安装位置
工作负荷中只选使用C++的桌面开发,然后点右下角的安装,等待安装完成。
Visual Studio工作负荷
Visual Studio安装中
等待VS安装完后,再次执行.\venv\Scripts\python -m pip install -r requirements.txt安装剩余的包,这次就能成功编译。
编译安装完成
接着再输入.\venv\Scripts\python -m pip install webrtcvad-wheels继续安装。
安装剩余的包
至此,项目环境基本搭建完成。

运行Mocking Bird

输入执行.\venv\Scripts\python web.py,会弹出一个防火墙,都勾上并点允许。
防火墙
解决防火墙后又又看到报错了,PydanticImportError:pydantic:parse raw as has been removed in V2.,这开源项目,这东西已被从V2中移除,这兼容性一言难尽。
报错-3
修复方法是安装旧版的,把 pydantic 版本降下来pip install "pydantic < 2.0.0",执行.\venv\Scripts\python -m pip install "pydantic < 2.0.0",等待安装完成后,再次执行.\venv\Scripts\python web.py,就成功跑起来了。
运行web
打开浏览器输入http://localhost:8080/即可看到效果,但是又报了一个错误,是缺少了模型文件。
缺少模型
去下载项目作者给出的模型https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 密码:4j5d(该链接挂了)
链接:https://pan.baidu.com/s/1jgSUX6I732CScoYPjzIW0g?pwd=w331
慢速下载
将模型放入\data\ckpt\synthesizer中,synthesizer是新建的文件夹,源代码中是不存在。
放置模型文件
在PowerShell中按下Ctrl + C停止web端,再次重新执行.\venv\Scripts\python web.py,但是又又又看到一个报错,缺少模块。
第四个错误
缺少,那就安装。执行.venv\Scripts\python -m pip install audio recorder_streamlit
安装缺少的模块
装完后再次运行web.py,这次终于没报错了,点击合成语音也能成功合成,cuda也动了起来。
CUDA

该文章源自:https://blog.tofumilk.top/#/post/29

参考资料:

  • 32
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《Google C++ Mocking Cookbook启蒙篇》是一本关于如何使用Google C++ Mocking框架的入门指南。 Google C++ Mocking Cookbook是Google Test框架的一部分,它提供了一种简单和灵活的方式来模拟和测试C++代码。该书适合那些对C++编程和测试有一定基础的读者。 书中首先介绍了Google Test和Google Mock框架的基本概念和使用方法。读者将学习如何使用Google Test编写单元测试,以及如何使用Google Mock创建和管理模拟对象。同时,该书还详细介绍了Google Mock框架的特性和高级用法,包括模拟函数、模拟类和模拟函数的重载。 在书中,作者通过一系列示例和案例来讲解各种测试和模拟的场景。读者将学习如何编写测试用例、设置预期和断言,并通过模拟对象来验证代码的行为和状态。 此外,书中还涵盖了一些高级主题,例如如何使用Google Mock框架集成到测试框架中,以及如何进行测试双向通信和测试异常情况等。 通过阅读这本书,读者可以深入了解Google C++ Mocking框架的原理和应用场景,掌握高效编写和管理测试用例的技巧,从而提高代码的质量和可维护性。 总之,《Google C++ Mocking Cookbook启蒙篇》是一本对使用Google C++ Mocking框架有兴趣的读者必读的入门指南。通过学习和实践,读者可以掌握基本的测试和模拟技术,为软件开发和测试带来更高的效率和质量。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值