一个AI实时变声工具

该框架是一款利用VITS技术的变声器,适用于Win10/11,要求显卡至少750TI,训练音源需RTX显卡。CPU需支持AVX2,推荐十代酷睿或三代锐龙。测试显示,清晰的麦克风输入对效果至关重要,AI变声有延迟且可能咬字不清晰,但能训练多种声线,相比传统变声器更依赖配置和模型质量。
摘要由CSDN通过智能技术生成

 一个基于VITS的简单易用的语音转换(变声器)框架。

配置要求
1 win10或win11系统,老显卡驱动要更新到最新版本
2 显卡750TI以上,如需训练音源,需RTX以上显卡,显存越大越好
3 CPU支持AVX2指令集,性能越高越推理延迟越低,建议十代酷睿或三代锐龙以上
4 清晰干净的麦克风,声卡麦克风最优

界面预览

290940ac6425d3229a03ef143ca0d553.png

测试效果如下:

测试下来对麦克风的要求很高,我用的蓝牙耳机,导致噪音比较大,声音也不是很清晰,如果声音出现断续的情况,可以更改延迟采样的时间。

1 AI变声不吃个人声线,只需要清晰的说化即可,传统变声器只能根据个人声线进行变化
2 可以训练模型,加载各种声线,语气声线多样化
相比于传统变声器缺点
1 延迟太高,通常都是1-5秒以上,传统变声器最低可以无延迟
2 咬字不清晰,气息非常奇怪,感情波动就会失真,非常吃模型的音源
3 吃配置较高,需要CPU和GPU双重占用,配置低就无法使用,大多目前只能兼容N卡
4 兼容性还是太差了,AI变声目前还不成熟,闪退稳定性有待优化

想尝试的朋友可以点下关注,后台回复RVC获取下载链接

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值