基于检索的语音转换WebUI项目推荐

董铮习Eugene

于 2024-09-13 21:45:36 发布

阅读量519

点赞数 5

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gitblog_09230/article/details/142223672

版权

基于检索的语音转换WebUI项目推荐

Retrieval-based-Voice-Conversion-WebUI 语音数据小于等于10分钟也可以用来训练一个优秀的变声模型！项目地址: https://gitcode.com/gh_mirrors/re/Retrieval-based-Voice-Conversion-WebUI

项目基础介绍和主要编程语言

项目名称: Retrieval-based Voice Conversion WebUI
项目链接: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
主要编程语言: Python

项目核心功能

Retrieval-based Voice Conversion WebUI（RVC）是一个基于VITS的简单易用的语音转换框架。其核心功能包括：

音色泄漏杜绝: 使用top1检索替换输入源特征为训练集特征，有效杜绝音色泄漏。
快速训练: 即便在相对较差的显卡上也能快速训练模型。
少量数据训练: 推荐至少收集10分钟低底噪语音数据，即可得到较好结果。
模型融合: 通过模型融合来改变音色，借助ckpt处理选项卡中的ckpt-merge功能。
简单易用的网页界面: 提供用户友好的网页界面，方便操作。
人声和伴奏分离: 可调用UVR5模型来快速分离人声和伴奏。
先进的人声音高提取算法: 使用InterSpeech2023-RMVPE算法，显著提高音高提取效果，同时比crepe_full更快、资源占用更小。

项目最近更新的功能

实时变声界面: 新增实时变声界面，支持端到端170ms延迟，若使用ASIO输入输出设备，已能实现端到端90ms延迟。
A卡/I卡加速支持: 新增对A卡和I卡的加速支持，提升训练和推理效率。
环境配置优化: 优化了环境配置流程，支持通过pip和poetry两种方式安装依赖。
预模型准备: 提供了详细的预模型准备指南，包括从Hugging Face space下载所需模型。
AMD显卡Rocm支持: 新增对AMD显卡Rocm技术的支持，仅适用于Linux系统。

通过这些更新，RVC项目在功能和性能上都有了显著提升，为用户提供了更加便捷和高效的语音转换体验。

Retrieval-based-Voice-Conversion-WebUI 语音数据小于等于10分钟也可以用来训练一个优秀的变声模型！项目地址: https://gitcode.com/gh_mirrors/re/Retrieval-based-Voice-Conversion-WebUI

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

董铮习Eugene 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。