LSTM模型

最新推荐文章于 2024-03-21 12:23:02 发布

Ambrosedream

最新推荐文章于 2024-03-21 12:23:02 发布

阅读量4.1k

点赞数 2

分类专栏：刷题笔记文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ambrosedream/article/details/114530308

版权

刷题笔记专栏收录该内容

14 篇文章 0 订阅

订阅专栏

概念

LSTM：长短期记忆细胞神经网络

长短期记忆网络是一种时间递归神经网络，适合处理和预测时间序列中间隔和延迟相对较长的重要事件。

使用遗忘门的LSTM适用于连续性的预测。

LSTM避免了RNN（循环神经网络）网络的梯度消失和梯度爆炸问题。
LSTM 使用记忆单元代替神经元。

组成

一个LSTM单元由一个记忆细胞 $C_t$ 和三个门结构组成（输入门 $i_t$ 、遗忘门 $f_t$ 、输出门 $o_t$ ）.

在 t 时刻， $x_t$ 代表输入数据， $h_t$ 代表隐藏层。 $X$ 代表向量外积， $+$ 代表叠加运算。公式如下：

$\begin{aligned} &f_t = \sigma(U_fx_t + W_fh_{t-1}+ b_f)\\ &i_t = \sigma (U_ix_t+W_ih_{t-1}+b_i)\\ &u_t = \tanh(U_ux_t+W_uh_{t-1}+b_u)\\ &c_t = f_t*c_{t-1} + i_t * u_t \\ &o_t = \sigma(U_ox_t + W_oh_{t-1}+b_o)\\ &h_t = o_t * \tanh(c_t) \end{aligned}$

U/W是矩阵权重，b代表偏移量， $\sigma$ 是sigmoid函数，符号*代表向量外积。

记忆单元图示

在这里插入图片描述
遗忘门： $C_{t-1}$ 首先需要先遗忘一些信息，所以先将 $H_{t-1}$ 与 $X_t$ 和 $b_f$ 做加权和，然后使用 $\color{#FF0000}{sigmoid}$ 函数处理，得到 $f_t$ ,代表着上一个细胞需要遗忘的信息权重 ,之后与上一个记忆细胞做外积，忘记一些信息。

输入门： 决定了要接收多少新信息到记忆细胞。

原有信息和新增信息分别由遗忘门和输入门控制，得到了当前记忆细胞（ $C_t$ ）,最后通过输出门过滤记忆细胞，更新后的记忆细胞获得当前隐藏层状态（最后一个公式），最后进行反向传播。

需要考虑的问题

神经网络的问题

过拟合
局部极小值
黑盒技术

其他问题

市场特征的非线性、政治经济条件以及经营者的期望相互作用，导致时间序列的线性模型并不适用。

一些问题的解决方法

适用遗传算法改进调参模型，可以提升LSTM预测效果。

参考文献

在这里插入图片描述

温故知新，未央书斋

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
LSTM模型

概念LSTM：长短期记忆细胞神经网络长短期记忆网络是一种时间递归神经网络，适合处理和预测时间序列中间隔和延迟相对较长的重要事件。使用遗忘门的LSTM适用于连续性的预测。LSTM避免了RNN（循环神经网络）网络的梯度消失和梯度爆炸问题。LSTM 使用记忆单元代替神经元。组成一个LSTM单元由一个记忆细胞 CtC_tCt 和三个门结构组成（输入门 iti_tit 、遗忘门 ftf_tft、输出门 oto_tot）.在 t 时刻，xtx_txt代表输入数据，hth_tht代表隐藏层。X
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ambrosedream 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。