RNN/LSTM初认识

最新推荐文章于 2024-10-31 16:13:38 发布

颜回啊颜回

最新推荐文章于 2024-10-31 16:13:38 发布

阅读量367

点赞数

分类专栏：神经网络文章标签：机器学习神经网络深度学习

本文链接：https://blog.csdn.net/weixin_43445142/article/details/106814046

版权

神经网络专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

RNN
LSTM

RNN

用于处理序列信息，这里的序列是指单个个体之间有联系，比如说一句话（词汇之间互有联系），一个视频（有很多相关联的帧）。因为是重复地使用同一个网络，所以也被称为递归网络。

RNN的结构

RNN
x：输入
o：输出
s：隐藏层
U,V,M：权重矩阵
上图忽略了权重！

RNN的特点

上述的U,V,M是共享的，打个比方，就是处理一个句子，句子不动，而RNN像一个滑窗一样从句头滑到句尾。容易梯度消失或爆炸。CNN 是在空间上共享参数，RNN 是在时间上（顺序上）共享参数。在这里插入图片描述

变式与推导

原理分析代码变式可以参见这篇文章你还没有看！！有空记录
https://zybuluo.com/hanbingtao/note/541458

LSTM

解决RNN的问题引出了LSTM

LSTM的结构

在这里插入图片描述

z是计算得到的当前输入内容
zⁱ是选择记忆信息的门控
z^f是选择忘记的门控
z^o是选择输出的门控
c^t是当前阶段单元状态
y^t是当前阶段输出
门控都用的是sigmoid函数，在0~1之间；z用的是tanh函数，-1 ~ 1之间。
在这里插入图片描述

阶段	描述	输入	输出
选择忘记	控制上一个状态的c^t-1哪些需要留哪些需要忘	门控z^f /上一个状态的c^t-1	c^t-1的有用部分
选择记忆	选择当前输入的有用信息	门控zⁱ/当前输入z	当前输入的有用信息隐藏操作
输出	得到当前状态的输出	门控z^o/c^t	当前阶段输出y^t/

ConvLSTM

ConvLSTM核心本质还是和LSTM一样，将上一层的输出作下一层的输入。不同的地方在于加上卷积操作之后，为不仅能够得到时序关系，还能够像卷积层一样提取特征，提取空间特征。这样就能够得到时空特征。并且将状态与状态之间的切换也换成了卷积计算。
关于时空特征的理解：
Temporal characterization occurs when you have a series of images taken at different time. Correlations between the images are often used to monitor the dynamic changes of the object.

Spatial characterization applies when you are analyzing one image. It includes but not limited to the coordinates, intensity, gradient, resolution, to name only a few.