记录LSTM公式、梯度消失现象/解决

咕噜咕噜day

已于 2022-06-30 12:06:02 修改

阅读量714

点赞数

分类专栏：深度学习基础文章标签： lstm rnn 深度学习梯度消失

于 2022-06-30 12:04:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36533552/article/details/125537997

版权

一. LSTM公式：

二. 简单总结：

1. RNN梯度：

RNN中同样的权重在各个时间步共享，最终的梯度为

各个时间步骤梯度的和。

2. 梯度消失现象怎么产生？：

RNN的梯度消失是指梯度被近距离梯度所主导，远距离梯度由于连乘导致太小，不能获取远距离的依赖关系。

比如sigmoid函数，导数最大值为1/4（y-y^2）, tanh 导数最大值为1. (1 - y^2)。

3. LSTM怎么解决RNN梯度消失问题？：

主要是通过Ct-1到Ct的优化：

最低0.47元/天解锁文章

咕噜咕噜day

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
记录LSTM公式、梯度消失现象/解决

LSTM记录
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。