Real-Time-Voice-Cloning（github声音克隆项目演示）

最新推荐文章于 2025-03-08 11:09:42 发布

漂流の少年

最新推荐文章于 2025-03-08 11:09:42 发布

阅读量3.6k

点赞数 3

分类专栏：机器学习&深度学习文章标签： pytorch deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YINZHE__/article/details/119042653

版权

机器学习&深度学习专栏收录该内容

32 篇文章

订阅专栏

github项目地址

①检查pytorch的安装

②ffmpeg是做什么的，在哪里下载？怎么使用？

ffmpeg是一个处理多媒体信息的框架，有视频采集、视频格式转换、视频抓图、给视频加水印等功能

requirements.txt

python项目中必须包含一个 requirements.txt 文件，用于记录所有依赖包及其精确的版本号，以便新环境部署

切换到项目目录，生成requirement.txt文件并查看

③Download Pretrained Models（预训练模型）

预训练模型作为包含所有三个模型（扬声器编码器、合成器、声码器）的档案。

存档带有与存储库相同的目录结构，您需要将其内容与存储库的根目录合并。

下完pretrained.zip并解压，有三个文件夹encoder、synthesizer、vocoder。

把这三个文件夹中的内容复制到项目中对应的三个同名文件夹中

④Test Configuration（测试配置）

python demo_cli.py

发现No module named 'librosa'

也就是说少了个librosa模块（librosa是一个非常强大的python语音信号处理的第三方库）

安装：pip install librosa

发现No module named 'torch' 安装：pip install torch

发现No module named 'unidecode' 安装：pip install unidecode

发现No module named 'inflect' 安装：pip install inflect

发现No module named 'sounddevice' 安装：pip install sounddevice

都安装完了，显示如下

⑤Download Datasets（数据集）

对于单独使用工具箱，建议下载 LibriSpeech/train-clean-100

train-clean-100.tar.gz下好解压，有一个LibriSpeech文件夹

在Real-Time-Voice-Cloning-master这个项目里面，自己建一个名为datasets的文件夹，将LibriSpeech文件夹放进去

终端切换到项目的当前目录

运行：python demo_toolbox.py -d datasets

即可Launch the Toolbox（启动工具箱）

在这过程中

发现No module named 'umap'

安装：pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple

发现"Unable to import 'webrtcvad'

安装：pip install webrtcvad

工具箱显示如下

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

漂流の少年 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。