记录学习过程,方便日后查用。本贴包括数学计算过程和模型解读。
如有错误请指出,感谢大家的指导。
图片来源 LSTM模型结构的可视化 - 知乎
淡绿色的方块被称为cell,是构成LSTM的主要结构。实际上对于RNN类网络来说,都会有一个这样的结构块,在时间上循环这个结构块就构成了RNN网络。上图是最基础的LSTM网络。
LSTM的单元输入总共有3个部分 h是隐藏层,X是数据输入,C可以看成是网络的记忆部分。所有红色的单元是运算符,运算过程就是简单的套用运算符;所有黄色的单元是网络层,运算过程类似感知机,sigma符号代表的激活函数默认为sigmoid函数。
数学运算过程
LSTM的cell内部总共有3个主要的门,第一个被称为忘记门(forget gate) ,用来决定上一轮的输入能有多少影响到这一轮的输入。
忘记门公式