RNN里面使用dropout

最新推荐文章于 2023-12-24 23:54:37 发布

喝粥也会胖的唐僧

最新推荐文章于 2023-12-24 23:54:37 发布

阅读量3.7k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhou_438/article/details/108577209

版权

深度学习专栏收录该内容

78 篇文章 12 订阅

订阅专栏

RNN通常意义上是不能使用dropout的，因为RNN的权重存在累乘效应，如果使用dropout的话，会破坏RNN的学习过程。

但是，Google Brain在15年专门发表了一篇文章研究这个：recurrent neural network regularization

他们在非循环阶段使用了dropout，改善了过拟合的现象

论文在两个地方使用了dropout，图中虚线部分就是使用了dropout，实线部分没有使用

非循环阶段不存在权重的累乘效应，不会破坏RNN的学习过程

为了更加清楚的看，画了一幅图：

图中的dropout和recurrent_dropout都是dropout，只是作业在不同的地方，keras对其也有设置了参数：

model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2))
还有就是我们可以在非RNN阶段也可以使用dropout，比如这样的：

model.add(..)
model.add(LSTM(10))
model.add(Dropout(0.5))

上面的的代码的意思是执行LSTM之后是可以使用dropout的

喝粥也会胖的唐僧

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
RNN里面使用dropout

RNN通常意义上是不能使用dropout的，因为RNN的权重存在累乘效应，如果使用dropout的话，会破坏RNN的学习过程。但是，Google Brain在15年专门发表了一篇文章研究这个：recurrent neural network regularization他们在非循环阶段使用了dropout，改善了过拟合的现象论文在两个地方使用了dropout，图中虚线部分就是使用了dropout，实线部分没有使用非循环阶段不存在权重的累乘效应，不会破坏RNN的学习过程为了更...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。