声音克隆技术探索

LANWENBING

已于 2023-07-29 14:03:38 修改

阅读量1k

点赞数

文章标签： python 语音识别深度学习

于 2023-05-27 14:07:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LANWENBING/article/details/130900716

版权

文章介绍了几个声音克隆项目，包括MockingBird在电音消除后的优化效果，VITS-fast-fine-tuning的一小时语音模型训练，以及SO-VITS-SVC和SO-VITS-SVC-5.0在歌唱克隆上的应用，后者据说表现优秀。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

声音克隆项目

项目一：MockingBird

https://github.com/babysor/MockingBird

电音消除技术

GitHub - Rikorose/DeepFilterNet: Noise supression using deep filtering

电音消除可以直接安装，方法如下：

pip install torch torchaudio deepfilternet SoundFile sox

deepFilter 要消除电子音的音频.wav

最后发现MockingBird效果并不理想

经过实验，克隆的音频必须要经过噪音消除，才能复刻出比较好的效果的音频，复刻出的音频也必须经过噪音消除才能听到比较好的音质的声音

项目二：VITS-fast-fine-tuning 未尝试

1小时训练自己的语音模型

Plachtaa/VITS-fast-fine-tuning: This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion (github.com)

项目三：SO-VITS-SVC

https://github.com/svc-develop-team/so-vits-svc

python preprocess_flist_config.py --speech_encoder hubertsoft --vol_aug

效果差劲

项目四：SO-VITS-SVC-5.0据说效果很赞，还没有试过

唱歌克隆：

PlayVoice/so-vits-svc-5.0: Core Engine of Singing Voice Conversion & Singing Voice Clone (github.com)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。