https://m.toutiaocdn.com/i6865068530287510020/?app=news_article×tamp=1598577285&use_new_style=1&req_id=20200828091444010131074200121AEC1F&group_id=6865068530287510020
AI越来越强大,不仅能模仿别人的表情,还能模仿别人说话的声音和语气,以后电话听到好友的声音也有可能不是本人哦,今天小编来讲讲一个实时声音克隆库Real-Time-Voice-Cloning
github地址为:https://github.com/CorentinJ/Real-Time-Voice-Cloning
该库是使用谷歌的开源声音处理算法(SV2TTS)实现。
SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以生成到新的语音。
如果您只想克隆您的声音(而不是其他人的声音):我建议在Resemble.AI上使用免费计划。
首先,因为您将获得更好的语音质量和更少的韵律错误,其次,因为它不需要像此回购协议那样的复杂设置。
具体的步骤
一、安装要求
需要Python 3.6或3.7才能运行该工具箱。
安装PyTorch(> = 1.0.1)。
安装ffmpeg。
运行pip install -r requirements.txt以安装其余必需的软件包。
二、下载预训练的模型
下载地址:https://github.com/CorentinJ/Real-Time-Voice-Cl