基于检索的语音转换WebUI项目推荐

基于检索的语音转换WebUI项目推荐

Retrieval-based-Voice-Conversion-WebUI 语音数据小于等于10分钟也可以用来训练一个优秀的变声模型! Retrieval-based-Voice-Conversion-WebUI 项目地址: https://gitcode.com/gh_mirrors/re/Retrieval-based-Voice-Conversion-WebUI

项目基础介绍和主要编程语言

项目名称: Retrieval-based Voice Conversion WebUI
项目链接: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
主要编程语言: Python

项目核心功能

Retrieval-based Voice Conversion WebUI(RVC)是一个基于VITS的简单易用的语音转换框架。其核心功能包括:

  1. 音色泄漏杜绝: 使用top1检索替换输入源特征为训练集特征,有效杜绝音色泄漏。
  2. 快速训练: 即便在相对较差的显卡上也能快速训练模型。
  3. 少量数据训练: 推荐至少收集10分钟低底噪语音数据,即可得到较好结果。
  4. 模型融合: 通过模型融合来改变音色,借助ckpt处理选项卡中的ckpt-merge功能。
  5. 简单易用的网页界面: 提供用户友好的网页界面,方便操作。
  6. 人声和伴奏分离: 可调用UVR5模型来快速分离人声和伴奏。
  7. 先进的人声音高提取算法: 使用InterSpeech2023-RMVPE算法,显著提高音高提取效果,同时比crepe_full更快、资源占用更小。

项目最近更新的功能

  1. 实时变声界面: 新增实时变声界面,支持端到端170ms延迟,若使用ASIO输入输出设备,已能实现端到端90ms延迟。
  2. A卡/I卡加速支持: 新增对A卡和I卡的加速支持,提升训练和推理效率。
  3. 环境配置优化: 优化了环境配置流程,支持通过pip和poetry两种方式安装依赖。
  4. 预模型准备: 提供了详细的预模型准备指南,包括从Hugging Face space下载所需模型。
  5. AMD显卡Rocm支持: 新增对AMD显卡Rocm技术的支持,仅适用于Linux系统。

通过这些更新,RVC项目在功能和性能上都有了显著提升,为用户提供了更加便捷和高效的语音转换体验。

Retrieval-based-Voice-Conversion-WebUI 语音数据小于等于10分钟也可以用来训练一个优秀的变声模型! Retrieval-based-Voice-Conversion-WebUI 项目地址: https://gitcode.com/gh_mirrors/re/Retrieval-based-Voice-Conversion-WebUI

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

董铮习Eugene

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值