LSTM原理

最新推荐文章于 2020-07-30 16:09:29 发布

辰出灬子归

最新推荐文章于 2020-07-30 16:09:29 发布

阅读量2.7k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CBH01050403/article/details/80525770

版权

本文介绍了LSTM（长短期记忆网络）的基本原理，作为RNN的一种特殊类型，LSTM通过输入门、遗忘门、输出门和细胞状态来解决长期依赖信息的学习问题。详细阐述了LSTM的结构，包括细胞状态、遗忘门、输入门和输出门的工作机制，并探讨了为何LSTM能有效处理长期依赖问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

Tip：
该博客里的内容是博主学习的一些心路历程，期间也会查阅一些其他博客和文献，还有一些自己的理解，可能会存在一些理解不正确的地方。如果阅读这篇博客请带着学习和质疑两种心态。如有问题，欢迎指出。

LSTM理论

1.LSTM介绍

LSTM（Long Short-Term Memory）是一种 RNN 的特殊类型，它可以学习长期依赖信息。通过引入了自循环，以产生梯度长时间持续流动的路径，解决RNN梯度消失的问题。它在RNN的基础上添加了输入门、遗忘门、输出门和细胞状态。

2.LSTM结构图

通过RNN和LSTM的结构图对比，可以直观地感受到LSTM在结构上的变化。
这里写图片描述

RNN结构图

这里写图片描述

LSTM结构图

下面看一下LSTM每个门控的结构图和公式，这样可能会容易理解一些。

①细胞状态：
我理解细胞状态应该代表的就是前些时刻的信息。它直接在整个链上运行，只有一些少量的线性交互。信息在上面流传保持不变会很容易。
这里写图片描述

细胞状态图

②遗忘门：
通过字面意思就可以感觉到，遗忘门就是决定会从细胞状态中丢弃什么信息。遗忘门的输入是 $h_{t-1}$ 和 $x_t$ ，输出一个在 0 到 1 之间的数值给每个在细胞状态

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。