今天推荐一个黑科技开源项目,只需要你 5 秒钟的声音对话,就能克隆出你的声音,而且能够实时的生成你任意语音。
是不是很顶?
我觉个例子,如果我这里有 300 条你说话的语音,我把你的语音数据用这个开源项目去训练,训练完成后,我就可以使用这个训练好的模型生成任何你说的语音了。
你会听到一个声音和你一模一样的人说你没说过的话,那种感觉真的细思极恐。
这个黑科技就是:Real-Time-Voice-Cloning,现在已经开源,GitHub 24K 的 Star,最重要的是,这个项目提供了 GUI 界面,交互傻瓜式操作,语音采集、训练、生成都可以交互完成,很方便。

地址:https://github.com/CorentinJ/Real-Time-Voice-Cloning
环境配置
首先你需要 Python 3.6 的环境、安装 PyTorch(要求版本 > = 1.0.1)。Pytorch 是深度学习框架,你可以通过这个站点来安装这个库。
https://pytorch.org/get-started/locally/
紧接着需要安装 ffmpeg:
地址 https://ffmpeg.org/download.html#get-packages。除此之外,你还需要安装其他的依赖包。将
本文介绍了GitHub上一个名为Real-Time-Voice-Cloning的开源项目,该项目能够仅用5秒声音片段克隆个人声音,并能实时生成任意语音。该项目提供GUI界面,支持交互式操作,包括语音采集、训练和生成。用户需要Python 3.6环境、PyTorch等依赖,下载预训练模型即可使用。虽然主要针对英语语音,用中文试用会有显著的外语口音。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



