【模型学习-LSTM】LSTM、循环神经网络

海绵_青年

已于 2023-04-13 10:02:48 修改

阅读量242

点赞数

文章标签： python

于 2023-04-11 10:51:08 首次发布

本文链接：https://blog.csdn.net/qq_45445505/article/details/130078590

版权

5 篇文章 0 订阅

订阅专栏

前言

文章不对LSTM的详细原理做过多讲解，仅描述其计算过程和数学表达。原理部分可以参照如下链接：

是RNN循环神经网络的变体形式，对比RNN网络，可以记忆长时序信息

RNN网络单元之间通过单一tanh函数进行连接

LSTM网络单元之间的链接要相对复杂一点，可分为：遗忘门、更新门、输出门

从左到右分别是：网络层，节点操作（矩阵相乘，矩阵相加），矢量转移，矩阵连接，矩阵复制

$f_t$ 经过 $s i g m o i d ()$ 函数，其数值区间为0-1，可以理解为“遗忘多少历史信息” or “保留多少历史信息”
- 当 $f_t$ =0，表示遗忘所有历史信息 $C_{t-1}$
- 当 $f_t$ =1，表示保留所有历史信息 $C_{t-1}$
$f_t$ 由上一时刻的短时状态 $h_{t-1}$ 和当下时刻的输入 $x_t$ 决定

关注