MockingBrid(AI拟声)教程

该博客介绍了如何利用MockingBird项目,在5秒内克隆声音并实时生成任意语音内容。主要涉及编码器、生成器和解码器的模型,通过预训练模型实现声音模仿。用户只需在UI界面配置参数并导入音频样本,即可生成仿生语音,同时推荐了一个免费的音频剪辑网站进行后期处理。
摘要由CSDN通过智能技术生成

该代码:用来模仿别人说话生成的一段语音的代码。

源码地址:GitHub - babysor/MockingBird: 🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time 

IDE:Pycharm2019

下载后的工程目录:

encoder:编码器

synthesizer:生成器

toolbox:ui工具箱

vocoder:解码器

如果只需要使用的话:这些都不用管,可以直接使用别人的预训练model.

环境安装:

输入:pip install requirements.txt

ca30b3914c9411ea3e8ef61914fb4c3d.png

预模型下载:

        github源码中提供了一些用户预训练出来的模型。当然你也可以使用自己制作的数据集,那个github中有讲解,这里我就不写了,有点费时间。使用别人的模型就好了。 

选择一个用户的文件进行下载。

下载完成之后将其中的模型文件,依次保存到

synthesizer,encoder,vocoder三个文件中。如下图所示

6650104402fab6cbc2cb2503d3d34889.png 

运行

        运行:demo_toolbox.py ----------弹出UI窗口:[中文界面]

        560a80c0d749dfa75e1fa7952ffa7d08.png

之后将其中的配置改为这个样子:并且在Browse中导入自己要模仿的音频信息或者使用Record进行录制音频信息。

Synthesizer和vocoder是可以选择的,Encoder就一个。

MaxLength是一句话的最长长度,如果太短了,会出现被截断的声音。

最后在该文本框中输入,你要模仿的文本信息,并点击Synthesize and vecode 

之后就可以听到Ai仿生的效果了。

如果要保存仿生后的音频文件,点击Export进行保存。

音频剪辑工具

这里对于音频的信息进行剪切和格式转换,推荐一个免费的网站。

Online MP3 Cutter - Cut Songs, Make Ringtones

非常好用,而且免费,不会和其他软件一样要冲会员,也不会加进去一段机械音。

669e9af9c35292fb0702412171ec3bba.png

  • 9
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

防空洞的仓鼠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值