LSTM学习

最新推荐文章于 2023-06-30 05:09:51 发布

饼干饼干圆又圆

最新推荐文章于 2023-06-30 05:09:51 发布

阅读量921

点赞数

文章标签： lstm rnn 学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Caramel_biscuit/article/details/124723749

版权

相比于RNN只传递一个状态ht,LSTM传递两个状态：ht和Ct
RNN中的ht相当于LSTM中的Ct。
Ct变化较慢，通常是上一个细胞状态Ct-1加上一些数值形成的
ht在不同节点下差别会很大
首先使用LSTM的输入xt和上一个时间步里传递下来的ht-1拼接得到四个状态。
在这里插入图片描述
zf、zi和zo是拼接向量乘以权重矩阵后，再通过sigmoid激活函数转换成0到1之间的数值——作为门控状态。
z是将结果通过tanh激活函数转换到-1到1之间的值。

LSTM三个阶段

忘记阶段。对上一个节点传进来的输入进行选择性忘记。
通过计算得到的zf作为忘记门控，控制上一个状态的ct-1哪些被遗忘。
选择记忆阶段，对这个阶段的输入选择性记忆。
输出阶段

复杂度：LSTM>GRU>RNN。当数据集不大时，LSTM和GRU效果差不多，但数据量很大时，LSTM效果更优。
RNN和GRU都只传递隐状态，LSTM还传递细胞状态。

对于普通RNN，要么求导公式总是大于1，要么总是在[0,1]范围内，连乘后就会出现梯度消失或梯度爆炸问题，而对于LSTM，任何时间步里，可以取[0,1]，或者[0,1]范围内，当时间步延伸到无穷时，可以通过设置gate，防止梯度消失和梯度爆炸。

饼干饼干圆又圆

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
LSTM学习

相比于RNN只传递一个状态ht,LSTM传递两个状态：ht和CtRNN中的ht相当于LSTM中的Ct。Ct变化较慢，通常是上一个细胞状态Ct-1加上一些数值形成的ht在不同节点下差别会很大首先使用LSTM的输入xt和上一个时间步里传递下来的ht-1拼接得到四个状态。zf、zi和zo是拼接向量乘以权重矩阵后，再通过sigmoid激活函数转换成0到1之间的数值——作为门控状态。z是将结果通过tanh激活函数转换到-1到1之间的值。LSTM三个阶段忘记阶段。对上一个节点传进来的输入进行选择性忘
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

饼干饼干圆又圆 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。