LSTM解决梯度消失问题

最新推荐文章于 2022-06-30 12:04:23 发布

厄运鹰人

最新推荐文章于 2022-06-30 12:04:23 发布

阅读量730

点赞数

分类专栏：机器学习深度学习（pytorch+tensorflow）文章标签：神经网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27166635/article/details/120043438

版权

深度学习（pytorch+tensorflow）同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

为什么rnn循环神经网络会有梯度消失的情况，而lstm可以避免这种情况的发生？

使用梯度下降的方式来更新，如果有很多个这样的数相乘的话，就会使得梯度趋近于0。
梯度消失导致的问题其实是权重w几乎不更新，这样就很难找到一个合适的权重w,去映射输入值与输出值之间的关系。 - LSTM中神经元之间的连接不仅仅有h, 还有信息C, h在神经元之间的传递会经过sigmoid函数处理，但是C不会。所以与C相关的权重W的更新不会因为神经元链过长而产生梯度消失的现象（指的是，遗忘门，信息增益门的权重w）。但是输出门的权重w，是可能会出现梯度消失的。所以可以说是高速通道C,掩盖了通道h的梯度消失的现象，所以从整体上看是没有梯度消失现象的。
LSTM结构分析
LSTM的第一步是决定我们要从细胞状态C中丢弃什么信息。
下一步是决定我们要在细胞状态中存储什么信息。
将上一个状态值乘以ft，以此表达期待忘记的部分。之后我们将得到的值加上 it∗C̃ t。这个得到的是新的候选值，按照我们决定更新每个状态值的多少来衡量.
输出门

交叉熵函数是什么？在什么地方用过？

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。