LSTM理解及代码Demo

最新推荐文章于 2024-07-31 07:40:50 发布

dayL_W

最新推荐文章于 2024-07-31 07:40:50 发布

阅读量6.7k

点赞数 3

分类专栏：深度学习文章标签： LSTM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013181595/article/details/100940057

版权

深度学习专栏收录该内容

16 篇文章 10 订阅

订阅专栏

LSTM原理

关于LSTM的原理很多大神的博客都介绍的非常详细了，这里简要的介绍一下，参考的博客和链接见文末。

RNN 在实际的应用中最主要的问题就是不能很好的捕捉到远程依赖，这是由它本身的性质决定的，尽管误差可以往后传播，但是由于梯度消失，很难调整前面的神经网络层。

而LSTM最主要的思想在于引入了遗忘门和更新门和输出门的思想，遗忘门表示对未来信息的丢失权重，更新门表示对当前信息的更新权重。

遗忘门，根据上一个时刻的 $h_{t-1}$ 和当前时刻的 $x_{t}$ 计算出，允许上一个时刻的 $C^{t-1}$ 通过的权重是多少，1表示全部通过，0表示全部丢弃。
在这里插入图片描述
更新们则根据上一个时刻的 $h_{t-1}$ 和当前时刻的 $x_{t}$ 计算出, 允许当前时刻的 $C^{*t-1}$ 通过的权重是多少，1表示全部通过，0表示全部丢弃。

最后，更新当前时刻的 $C^{t}$ ，最后根据输出门计算得到隐藏层的输出：
在这里插入图片描述

GRU原理

在这里插入图片描述
GRU 里面 $Z_{t}$ 表示更新门，有当前输入和上个隐层输出计算得到，表示当前的输入有多少传递到当前的隐层， $r_{t}$ 为记忆门，表示上个时刻的隐层输出有多少传递到当前层的输出。

区别

GRU结构比较简单，计算代价较小，可以把网络设计的很深
LSTM 结构复杂，性能比较强大，但是计算量比较大

样例代码

在循环神经网络中有很多中结构，输入输出可以是不同的长度，对应得到不同的结构，比如下图所示：
在这里插入图片描述

1-1

输入长度为1，输出长度也为1的，这种情况和传统的神经网络一样，一个输入得到一个输出。

1-N

1和输入，N个输出的情况有2种，一个是每个时刻都是x作为输入，如下图所示：
在这里插入图片描述
还有一种情况就是最开始有1个输入，以后的输入都是上一个时刻的输出。

N-1

输入长度为N，输出长度为1的模型，典型的例子有给定一段评论，需要评定用户的情感得分。

N-N

输入长度为N，输出长度也为N，也就是输入长度等于输出长度的情况，比较典型的有实体命名识别的任务，判断当前这个词汇是不是命名实体的一部分，还有比较典型的是序列生成，输入是当前这个序列，输出是移动一位的下一个词汇。

N-M

输入长度为N，输出长度为M的情况，输入长度和输出长度不等，最典型的情况就是翻译，具体做法是先对输入做一个编码，全部存在在一个结构中，然后依次对这个信息做解码，输出翻译的语句。

本打算把每种情况的 demo 代码都整理一下，放上去，时间不够了，先搁在这里。

参考文献

关注

3
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

dayL_W CSDN认证博客专家 CSDN认证企业博客

码龄11年

258: 原创

3万+: 周排名

209万+: 总排名

99万+: 访问

: 等级

7947: 积分

552: 粉丝

452: 获赞

153: 评论

3041: 收藏

私信

关注

热门文章

分类专栏

最新评论

解决开发板ping不通主机和虚拟机的问题
weixin_73554503: 哥，你解决了吗，我也是！！！！
PX4中混控器Mixer的分析
weixin_47566232: 您好，我想向您请教一下，px4的控制组具体定义在哪个文件夹呢？
解决开发板ping不通主机和虚拟机的问题
z290048663: 建议直接用集成好网卡的电脑，直接装个ubuntu kylin去做开发，虚拟机麻烦太多。
解决开发板ping不通主机和虚拟机的问题
弟级炼丹师: 请问你后来有解决吗？我也遇到了这个问题，用USB外置网卡，开发板能够ping通电脑，电脑能和虚拟机互相ping通，但是开发板ping不通虚拟机
USB摄像头驱动配置及V4L2编程
宇君: 你好，请教一个问题，USB摄像头在linux虚拟机下无法输出图像，是为什么啊，具体的情况请移步到我的贴子https://blog.csdn.net/chenxy80/article/details/129224175

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。