长短期记忆网络（LSTM）简述

最新推荐文章于 2024-08-29 11:00:00 发布

豪雄Hero

最新推荐文章于 2024-08-29 11:00:00 发布

阅读量2.4w

点赞数 5

分类专栏：阅读笔记文章标签：神经网络 LSTM

本文链接：https://blog.csdn.net/u014003962/article/details/51870684

版权

本文介绍了LSTM（长短期记忆网络）的基本原理和工作方式，作为递归神经网络（RNN）的一种，LSTM旨在解决RNN在处理长期依赖问题时的梯度消失问题。通过遗忘门、输入门和输出门，LSTM能有效地学习和维护长期信息。此外，还提到了LSTM的一些变体，如窥视孔连接、门限递归单元（GRU）等。

摘要由CSDN通过智能技术生成

本文是学习LSTMs入门知识的总结。

LSTM（Long-Short Term Memory）是递归神经网络（RNN:Recurrent Neutral Network）的一种。
RNNs也叫递归神经网络序列，它是一种根据时间序列或字符序列（具体看应用场景）自我调用的特殊神经网络。将它按序列展开后，就成为常见的三层神经网络。常应用于语音识别。

虽然前馈神经网络取得很大成功，但它无法明确模拟时间关系，并且所有数据点都是固定长度的向量。所以就诞生了递归神经网络，递归即自我调用，递归神经网络与其他网络的不同之处在于它的隐含层是能够跨越时间点的自连接隐含层，隐含层的输出不仅进入输出端，还进入了下一个时间步骤的隐含层，所以它能够持续保留信息，能够根据之前状态推出后面的状态。
按时间序列展开RNN
RNN每个时间状态的网络拓扑结构相同，在任意t时间下，包含输入层、隐含层、输出层。RNN的隐含层的输出一分为二，一份传给输出层，一份与下一时刻输入层的输出一起作为隐含层的输入。RNN的激活函数仍为sigmoid函数或tanh函数。
RNN与BPNN对比图