Fastdiff代码运行笔记

最新推荐文章于 2024-05-31 09:50:35 发布

theshycoder

最新推荐文章于 2024-05-31 09:50:35 发布

阅读量412

点赞数 4

文章标签：笔记深度学习神经网络语言模型人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jdjxjxjj/article/details/130434693

版权

最近在研究深度学习中扩散模型在语音合成（TTS）中的应用，目前主要在跑diffwave、DiffGAN，FastDiff、Prodiff等效果不错的模型。下面是FastDiff的运行笔记：

文献：FastDiff: A Fast Conditional Diffusion Model for High-Quality Speech Synthesis

代码：https://github.com/Rongjiehuang/FastDiff

环境：torch 1.12 数据集采用 LJSpeech-1.1

1 首先配置config文件，设置数据集位置及预处理后的输出位置（建议用绝对路径，用的相对路径没识别出来）

同时尽量按照request中安装环境，否则有可能出现Moduelnotfind等报错）
fastdiff-config

2 数据预处理

以config用python运行 pre_align.py binarize.py 进行数据预处理，进行了对齐并转换

3 在task中设置以config文件以及实验名称运行run.py文件至此模型开始训练

同时也打印了模型的所有结构，baseconfig配置文件中可更改训练参数，等训练完成便可inference了。

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Fastdiff代码运行笔记

扩散模型在语音合成中的应用及代码运行笔记
复制链接

扫一扫

theshycoder

CSDN认证博客专家 CSDN认证企业博客

码龄5年

南京医科大学

3: 原创

72万+: 周排名

17万+: 总排名

1520: 访问

: 等级

59: 积分

14: 粉丝

23: 获赞

4: 评论

14: 收藏

私信

关注

热门文章

最新评论

语音合成论文详解 SR-TTS: a rhyme-based end-to-end speech synthesis system
theshycoder: 需要源代码的可以私聊或者邮件交流哦
DiffGAN-TTS论文及代码运行笔记
iddaweitianlong: 非常感谢您的分享，这篇博客的内容非常有价值。讲到了几乎会遇到的全部bug，但是能不能请教您一下如何跳过val阶段，这将对我非常有帮助，非常感谢。
DiffGAN-TTS论文及代码运行笔记
CSDN-Ada助手: 非常感谢您分享DiffGAN-TTS论文及代码运行笔记，这篇博客的内容非常有价值。扩散模型和GAN的结合确实是一个很有创意的点子，而且在语音领域的应用也非常有前途。除了您提到的内容，还有一些相关的知识和技能可以扩展，比如语音信号处理、语音识别等方面的内容，这些都是非常重要的领域，可以进一步加强您对语音技术的理解和应用能力。希望您能够继续保持创作，并且分享更多有价值的内容。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Fastdiff代码运行笔记
CSDN-Ada助手: 恭喜您开始博客创作，阐述了关于Fastdiff代码的运行笔记。希望您能够继续分享您的经验和见解，让更多人受益。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。