DiffSinger学习资料汇总 - 基于浅层扩散机制的歌声合成模型

DiffSinger

DiffSinger简介

DiffSinger是一个基于浅层扩散机制的歌声合成(SVS)和文本转语音(TTS)模型,由浙江大学等机构的研究人员提出。该项目的主要特点包括:

  • 采用浅层扩散机制,能生成高质量和富有表现力的歌声/语音
  • 支持歌声合成(SVS)和文本转语音(TTS)两种任务
  • 开源了模型代码和预训练模型,方便研究人员和开发者使用

项目资源

代码仓库

论文

在线Demo

快速上手

  1. 环境配置
conda create -n diffsinger python=3.8
conda activate diffsinger
pip install -r requirements.txt
  1. 运行DiffSpeech(TTS版本)

参考TTS使用文档

  1. 运行DiffSinger(SVS版本)

参考SVS使用文档

相关数据集

  • LJSpeech: 英语单人语音数据集
  • PopCS: 中文流行歌曲数据集
  • OpenCpop: 开源中文流行歌曲数据集

延伸阅读

总结

DiffSinger作为一个开源的歌声合成和语音合成模型,为相关研究和应用提供了良好的基础。希望本文汇总的资料能帮助读者快速了解和使用DiffSinger项目。如有任何问题,欢迎在GitHub仓库中提issue讨论。


文章连接:www.dongaigc.com/a/diffsinger-learning-resources-singing-model
https:// www.dongaigc.com/a/diffsinger-learning-resources-singing-model     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值