参考博客:LSTM的公式推导详解
下面贴出一些关键的推导图片:
Forward Pass :
其中涉及三个Gate和中间Cell的计算,需要注意的是三个Gate使用的激活函数是f,而Input的激活函数是g、Cell输出的激活函数是h
反向传播中需要更新的 —> 所有梯度:
Backpass
第一下,从外部输出到 Cell Output的梯度
最后一步 汇总:
参考博客:LSTM的公式推导详解
下面贴出一些关键的推导图片:
Forward Pass :
其中涉及三个Gate和中间Cell的计算,需要注意的是三个Gate使用的激活函数是f,而Input的激活函数是g、Cell输出的激活函数是h
反向传播中需要更新的 —> 所有梯度:
Backpass
第一下,从外部输出到 Cell Output的梯度
最后一步 汇总: