深入理解LSTM神经网络

最新推荐文章于 2025-03-14 21:10:10 发布

CharlotteMen

最新推荐文章于 2025-03-14 21:10:10 发布

阅读量4.7w

点赞数 22

分类专栏：神经网络文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/menc15/article/details/71271566

版权

本文深入探讨LSTM网络，解释其核心思想、记忆单元的工作原理，以及常见的变种，包括遗忘门、输入门和输出门的角色，以及如何通过门控机制实现信息的选择性保留和遗忘。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文内容及图片主要参考：Understanding LSTM Networks

LSTM核心思想

LSTM最早由 Hochreiter & Schmidhuber 在1997年提出，设计初衷是希望能够解决神经网络中的长期依赖问题，让记住长期信息成为神经网络的默认行为，而不是需要很大力气才能学会。

LSTM记忆单元

LSTM-RNN展开图

下面是对LSTM单元内各部分的理解：

LSTM的关键是单元状态（cell state），即图中LSTM单元上方从左贯穿到右的水平线，它像是传送带一样，将信息从上一个单元传递到下一个单元，和其他部分只有很少的线性的相互作用。
这里写图片描述

LSTM通过“门”（gate）来控制丢弃或者增加信息，从而实现遗忘或记忆的功能。“门”是一种使信息选择性通过的结构，由一个sigmoid函数和一个点乘操作组成。sigmoid函数的输出值在[0,1]区间，0代表完全丢弃，1代表完全通过。一个LSTM单元有三个这样的门，分别是遗忘门（forget gate）、输入门（input gate）、输出门（output gate）。

门（gate）

遗忘门（forget gate）：遗忘门是以上一单元的输出 $h_{t-1}$ 和本单元的输入 $x_t$ 为输入的sigmoid函数，为

最低0.47元/天解锁文章

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。