LSTM(长短期记忆) Bi-LSTM(双向长短时记忆)

最新推荐文章于 2024-05-24 01:05:04 发布

sdfreregtrh

最新推荐文章于 2024-05-24 01:05:04 发布

阅读量2.5w

点赞数 9

分类专栏：机器学习 nlp 神经网络文章标签： LETM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43027596/article/details/101022774

版权

LSTM是RNN的变形,也就是循环神经网络的形式之一,主要解决传统RNN记忆问题,距离较远的文本信息无法得到利用、距离较近但语义上关联不大的文本信息造成了太大的干扰。(像是一个容易遗忘的老人,记不住太久远之前的信息,所以就出现了LSTM,让他只记住有用的信息)
在这里插入图片描述
传统RNN的问题分析:比如输入文本是我今天要做红烧排骨,首先要准备排骨,然后…,最后一道美味的菜就出锅了.这个时候我们要让RNN来判断我们到底做了什么菜,RNN可能给出辣子鸡这个答案,然后就反向的去推导误差,在循环神经网络中，由于模型每个时刻的状态都是由之前的状态的乘积得来的，那么根据链式法则，如果每一层神经元对上一层的输出的偏
导乘上权重结果都小于 1，则在经过足够多的传播之后，误差对输入层的梯度会趋近于 0，即梯度消失；反之，则梯度会随着反向传播层数的增加而呈指数增长，导致梯度爆炸(梯度爆炸可以用剪裁来解决)
梯度消失:

梯度爆炸:
在这里插入图片描述
为了解决上面出现的梯度消失的问题,就出现了LSTM(长短期记忆)

具体LSTM模型是怎么实现的呢?

相对于传统的RNN,LSTM的输入由x(t)[输入数据],a(t-1)[隐藏层信息]两个数据变成了x(t)[输入数据],a(t-1)[隐藏信息],c(t-1)[记忆单元]

最低0.47元/天解锁文章

关注

9
点赞
踩
106

收藏

觉得还不错? 一键收藏
1
评论
LSTM(长短期记忆) Bi-LSTM(双向长短时记忆)

LSTM是RNN的变形,也就是循环神经网络的形式之一,主要解决传统RNN记忆不了太长时间数据问题(像是一个容易遗忘的老人,记不住太久远之前的信息,所以就出现了LSTM,让他只记住有用的信息)传统RNN的问题分析:比如输入文本是我今天要做红烧排骨,首先要准备排骨,然后…,最后一道美味的菜就出锅了.这个时候我们要让RNN来判断我们到底做了什么菜,RNN可能给出辣子鸡这个答案,然后就反向的去推导误差...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。