Real-Time-Voice-Cloning(github声音克隆项目演示)

github项目地址

①检查pytorch的安装

②ffmpeg是做什么的,在哪里下载?怎么使用?

原文地址

ffmpeg是一个处理多媒体信息的框架,有视频采集、视频格式转换、视频抓图、给视频加水印等功能

requirements.txt

python项目中必须包含一个 requirements.txt 文件,用于记录所有依赖包及其精确的版本号,以便新环境部署

切换到项目目录,生成requirement.txt文件并查看

③Download Pretrained Models(预训练模型)

预训练模型作为包含所有三个模型(扬声器编码器、合成器、声码器)的档案。

存档带有与存储库相同的目录结构,您需要将其内容与存储库的根目录合并。

下完pretrained.zip并解压,有三个文件夹encoder、synthesizer、vocoder。

把这三个文件夹中的内容复制到项目中对应的三个同名文件夹中

④Test Configuration(测试配置)

python demo_cli.py

发现No module named 'librosa'

也就是说少了个librosa模块(librosa是一个非常强大的python语音信号处理的第三方库

安装:pip install librosa

发现No module named 'torch'        安装:pip install torch

发现No module named 'unidecode'        安装:pip install unidecode

发现No module named 'inflect'        安装:pip install inflect

发现No module named 'sounddevice'        安装:pip install sounddevice

都安装完了,显示如下

 ⑤Download Datasets(数据集)

对于单独使用工具箱,建议下载 LibriSpeech/train-clean-100

train-clean-100.tar.gz下好解压,有一个LibriSpeech文件夹

在Real-Time-Voice-Cloning-master这个项目里面,自己建一个名为datasets的文件夹,将LibriSpeech文件夹放进去

终端切换到项目的当前目录

运行:python demo_toolbox.py -d datasets

即可Launch the Toolbox(启动工具箱)

在这过程中

发现No module named 'umap'        

安装:pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple

发现"Unable to import 'webrtcvad'       

安装:pip install webrtcvad

工具箱显示如下 

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

漂流の少年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值