LSTM和双向LSTM讲解及实践

最新推荐文章于 2025-02-20 23:31:54 发布

big_matster

最新推荐文章于 2025-02-20 23:31:54 发布

阅读量9.1k

点赞数 14

分类专栏：模块复现文章标签： lstm 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuxingseng123/article/details/128165046

版权

目录：

RNN的长期依赖问题
LSTM原理讲解
双向LSTM原理讲解
keras实现LSTM和双向LSTM

RNN 的长期依赖问题

在上篇文章中介绍的循环神经网络RNN在训练的过程中会有长期依赖的问题，这是由于RNN模型在训练时会遇到梯度消失(大部分情况)或者梯度爆炸(很少，但对优化过程影响很大)的问题。对于梯度爆炸是很好解决的，可以使用梯度修剪(Gradient Clipping)，即当梯度向量大于某个阈值，缩放梯度向量。但对于梯度消失是很难解决的。所谓的梯度消失或梯度爆炸是指训练时计算和反向传播，梯度倾向于在每一时刻递减或递增，经过一段时间后**，梯度就会收敛到零(消失)或发散到无穷大(爆炸)。简单来说，长期依赖的问题就是在每一个时间的间隔不断增大时**，RNN会丧失到连接到远处信息的能力。

如下图，随着时间点t的不断递增，当t时刻和0时刻的时间间隔较大的时候， $t$ 时刻的记忆 $h t$ 可能已经丧失了学习连接到远处0时刻的信息的能力了。
假定 $x_0$ ,的输入为“我住在深圳”。后面插入了很多其他的句子，然后在 $x_t$ 输入了：我在市政府上班，由于 $x_0和x_t$ 相差很远，当RNN输入到 $x_t$ 时， $t$ 时刻的记忆已经丧失了 $x_0$

最低0.47元/天解锁文章

博客等级

码龄5年

257
原创

259
点赞

1305
收藏

132
粉丝

关注

私信

热门文章

分类专栏

最新评论

零样本学习—Learning to detect unseen object classes by between-class attribute
丨樱珏丨: 你好，想问一下博主，这个是在哪儿看的
医疗实体及关系识别挑战赛
Bing激凌: 您好！同求数据集！一位学生找不碎掉了联系方式2233054933@qq.com
LSTM和双向LSTM讲解及实践
weixin_40901147: 写得是真的好，很清晰。细胞状态就纪录语境（主题）变迁的变量，隐藏状态就是纪录注意力信息的变量（语法，用词）。新的细胞状态由新输入状态和过去的细胞状态隐藏状态决定，就是要细致分辨主题的变化，这是遗忘门和输入门的合作原理。新的隐藏状态是由新的细胞状态（新主题）和新的输入状态决定，这是输出门的工作原理。这决定了此刻此句话的意思。一个圆形相当于一个LSTM块。双向LSTM就是，若干句话顺着读产生上文语境，反着读产生下文语境，分别有上文细胞状态列和下文细胞状态列，对应输入状态产生产生上文隐藏和下文隐藏状态，对应着上下文的特征。共同决定此处特征。
open-set recognition(OSR)开集识别
qq_37441443: UKCS(unknown known classed)该怎么理解,能给个具体的例子吗
LSTM和双向LSTM讲解及实践
境界面上的双曲线: 你可以去看一下CNN+LSTM的网络结构

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

big_matster 您的鼓励，是给予我最大的动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。