【DL小结3】RNN与LSTM

最新推荐文章于 2024-03-11 17:38:52 发布

==樛木==

最新推荐文章于 2024-03-11 17:38:52 发布

阅读量588

点赞数

分类专栏：深度学习之个人总结文章标签： RNN LSTM BiLSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38493025/article/details/84282901

版权

传统的神经网络，层与层之间是全连接的，但是每层内部的节点是无连接的，因此无法利用上下文关系。

1.RNN

RNN最大的不同之处就是在每层内部的节点之间也建立起权连接。
在这里插入图片描述

针对问题：训练样本是序列数据
模型思想：循环反馈
模型特点：
（1）当前时间的隐藏状态是由上一时间的隐藏状态和当前时间的输入x共同决定的
（2）U、V、W权值共享
模型缺点：梯度消失，无法处理长序列数据（解决：LSTM、GRU）

RNN的前向传播

在这里插入图片描述

基于时间反向传播BPTT

循环神经网络(RNN)模型与前向反向传播算法 - 刘建平Pinard - 博客园
https://www.cnblogs.com/pinard/p/6509630.html

RNN的缺点

梯度爆炸/消失、很难学到长距离的信息依赖
在这里插入图片描述

2.LSTM

使用LSTM模型可以更好的捕捉到较长距离的依赖关系。因为LSTM通过训练过程可以学到记忆哪些信息和遗忘哪些信息。

在这里插入图片描述
针对RNN梯度消失问题，LSTM对序列索引位置t的隐藏结构做改进：

新增另一个隐藏状态，称为细胞状态（LSTM的核心思想）
设置门控结构控制细胞状态：遗忘门、输入门、输出门

2.1 遗忘门

遗忘门决定了上一时刻的细胞状态 $C^{(t-1)}$ （代表长期的记忆）有多少保留到当前时刻的细胞状态

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【DL小结3】RNN与LSTM

1.RNN针对问题：训练样本是序列数据模型思想：循环反馈模型特点：（1）随着序列的推进，前面的隐层将会影响后面的隐层（2）U、V、W权值共享（3）每个输入只与它本身的那条路线建立权连接，不会和别的神经元连接。模型缺点：梯度消失，无法处理长序列数据（解决：LSTM、GRU）RNN的前向传播基于时间反向传播BPTT2.LSTM针对RNN梯度消失问题，对序列索引位置t的隐...
复制链接

扫一扫

专栏目录

==樛木== CSDN认证博客专家 CSDN认证企业博客

码龄7年

98: 原创

5万+: 周排名

63万+: 总排名

23万+: 访问

: 等级

2615: 积分

66: 粉丝

84: 获赞

76: 评论

342: 收藏

私信

关注

分类专栏

最新评论

【bug解决】No OpKernel was registered to support Op 'CudnnRNN' with these attrs.
ShAn DiAn: 哥，你现在解决了吗，求帮助
【bug解决】You should consider upgrading via the 'pip install --upgrade pip' command.
Reconciler: 非常感谢！一下就装上了！!
【ML小结1】ML入门
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)使用标准目录。
IDEA连接Spark集群执行Scala程序
一个不知道取什么昵称的网友: 大佬牛批
【bug解决】No OpKernel was registered to support Op 'CudnnRNN' with these attrs.
不二651: 请问现在搞清楚了吗？因为我用tensorflow-gpu也还是出现这个问题，不知道怎么解决

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。