Tacotron2讲解

最新推荐文章于 2024-05-11 11:15:00 发布

Zero_to_zero1234

最新推荐文章于 2024-05-11 11:15:00 发布

阅读量8.9k

点赞数 1

分类专栏： TTS 深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/suiyueruge1314/article/details/107185195

版权

深度学习同时被 3 个专栏收录

112 篇文章 5 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

参考博客：
https://blog.csdn.net/whjkm/article/details/89321954#commentBox
https://blog.csdn.net/yunnangf/article/details/79585089

github代码：
https://github.com/NVIDIA/tacotron2

一、模型结构
模型结构上，tacotron2与tacotron基本类似，除了CBHG结构和Griffin结构上略有区别
Tacotron：
在这里插入图片描述
Tacotron2：

上图来自: https://blog.csdn.net/whjkm/article/details/89321954#commentBox

二、重点区别：
1、encoder部分，使用了embedding + 3Conv_layers + Bi-directional_LSTM
2、attention使用的是location sensitive attention，可参考：https://www.cnblogs.com/mengnan/p/9527797.html
3、Pre_net的dropout是一直设置为 true 的（据说是根据实验效果），post_net中最后一层一般为linear激活函数
4、最后的 mel_output_post 是经过 post_net 和 linear_projection相加得到
5、多帧预测方面，虽然Tacotron2没有使用多帧，但是实现原理类似

三、代码部分
此博客已经讲的比较详细，建议使用上面的模型结构图，理清模型结构，再细读代码。https://blog.csdn.net/whjkm/article/details/89321954#commentBox

Zero_to_zero1234

关注

1
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
Tacotron2讲解

参考博客：https://blog.csdn.net/whjkm/article/details/89321954#commentBoxhttps://blog.csdn.net/yunnangf/article/details/79585089github代码：https://github.com/NVIDIA/tacotron2一、模型结构模型结构上，tacotron2与tacotron基本类似，除了CBHG结构和Griffin结构上略有区别Tacotron：Tacotron2：二
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。