声音克隆技术探索

文章介绍了几个声音克隆项目,包括MockingBird在电音消除后的优化效果,VITS-fast-fine-tuning的一小时语音模型训练,以及SO-VITS-SVC和SO-VITS-SVC-5.0在歌唱克隆上的应用,后者据说表现优秀。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


声音克隆项目

项目一:MockingBird

https://github.com/babysor/MockingBird

电音消除技术

​​​​​​GitHub - Rikorose/DeepFilterNet: Noise supression using deep filtering

电音消除可以直接安装,方法如下:

pip install torch torchaudio  deepfilternet SoundFile sox

deepFilter  要消除电子音的音频.wav

最后发现MockingBird效果并不理想

经过实验,克隆的音频必须要经过噪音消除,才能复刻出比较好的效果的音频,复刻出的音频也必须经过噪音消除才能听到比较好的音质的声音

项目二:VITS-fast-fine-tuning 未尝试

1小时训练自己的语音模型

Plachtaa/VITS-fast-fine-tuning: This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion (github.com)

项目三:SO-VITS-SVC

https://github.com/svc-develop-team/so-vits-svc

python preprocess_flist_config.py --speech_encoder hubertsoft   --vol_aug

效果差劲

项目四:SO-VITS-SVC-5.0据说效果很赞,还没有试过

唱歌克隆:

PlayVoice/so-vits-svc-5.0: Core Engine of Singing Voice Conversion & Singing Voice Clone (github.com)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值