LSTM学习记录

要努力的小菜鸟

已于 2022-03-20 18:33:53 修改

阅读量1.2k

点赞数

分类专栏：深度学习文章标签： lstm rnn 深度学习神经网络

于 2022-03-16 19:15:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DBling1205/article/details/123518163

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

前言
一、为什么要用LSTM？
二、LSTM结构介绍
- 1.大体结构
- 2.三个门结构
总结

前言

一些关于LSTM的学习记录。

一、为什么要用LSTM？

LSTM（Long short-term memory），长短时记忆网络。

在学习LSTM之前，我们首先应当掌握RNN网络的相关知识，RNN是循环神经网络，是一个高度重视序列信息的网络。序列，即意味着“前后关系”。

RNN的基础结构仍是神经网络，但为了存放序列信息，其比全连接多了隐藏层的循环操作，它具有一定的记忆功能，但其缺点是输入数据越早，在隐藏层所占据的影响越小，故为克服其弊端，LSTM由此诞生。

二、LSTM结构介绍

1.大体结构

LSTM参考人类的记忆模式，记住重要的信息、遗忘相对不重要的信息，为了实现这个功能，相对于RNN网络而言，LSTM增加了细胞状态（Cell State），我们可以将它看作是关于信息的“记忆”，上一层的细胞状态经过遗忘和新的记忆的选择存储后，继续流向下一个细胞。

LSTM在一个细胞内的结构

这里图中可见，细胞状态 C_t在最上面传播，隐藏层状态h_t在下面传播，他们的初始状态为全0。隐藏层状态h_t-1与新的输入x_t对细胞状态进行修改。

在一个细胞中包含三个门，从左到右依次是遗忘门、输入门和输出门。

2.三个门结构

（1）遗忘门
在这里插入图片描述

遗忘门将上一层的隐藏状态h_t和当前的输入X_t进行拼接，传入sigmod函数中，映射到[0,1]中，越接近0则意味着越应该被丢弃，越接近1则意味着越应该被保留。与上一层的细胞状态C_t-1相乘，就是完成了对C_t-1中信息的选择，对不重要信息的遗忘。

（2）输入门
在这里插入图片描述

输入门决定加入多少新输入的信息到细胞状态中来。可以看到输入门分为 i_t 和 C_t 两部分，前者同遗忘门类似，将其映射到[0,1]之间，0表示不重要，1表示重要；后者输入tanh函数。 i_t 与后者相乘，决定了tanh输出结果的保留与舍弃，在这里我们将它看作是新输入信息的保留。

接下来就是对细胞状态的更新，经遗忘门与上层细胞状态点乘后得到的结果，与输入门得到的结果相加，就完成了对上层不重要信息的遗忘和新加入信息的选择保留，即结束了对细胞状态的更新。

（3）输出门
在这里插入图片描述

输出门确定的是将细胞状态的多少部分输出为隐藏状态的值h_t。首先将已更新的细胞状态经过一个tanh函数的映射，与h_t-1和x_t经sigmod函数映射后的门相乘，确定隐藏状态应携带的信息。最后将更新后的隐藏状态h_t和细胞状态C_t输入下一时刻。

总结

最后梳理：
遗忘门决定了遗忘多少上一层的细胞状态；
输入门决定保留多少新输入的信息；
输出门决定携带多少信息作为隐藏状态输入下一时刻的细胞。

在结构图中，细胞状态始终在最上面的线路进行更新传播，隐藏状态在下面线路；
细胞状态和隐藏状态的初始状态为全0；
细胞状态通过隐藏状态和输入信息进行调整和更新，隐藏状态通过更新后的细胞状态进行更新。

要努力的小菜鸟

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
LSTM学习记录

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、为什么要用LSTM？二、LSTM结构介绍1.大体结构2.读入数据总结欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

要努力的小菜鸟 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。