LSTM的完整推导过程,附上推导的手写稿

1、LSTM结构分析


说明:LSTM只是RNN的一种,只是将sigmoid神经元替换成LSTM单元。整体上的结构和前向全连接神经网络类似,也会有输入层结点,输出层结点。上图的结构就是有4个输入层结点,2single-cell LSTM memory blocks,5个输出层结点。

2、符号说明:


3、前向过程



说明:前向传播过程,可以看出,对于输入门,忘记门,输出门的建模方式,其实本质上都是一样的。对<当前时刻的输入,上一时刻隐层的输出,上一时刻的状态>进行线性加权,然后通过激活函数进行非线性变换。跟sigmoid神经元的建模方式,差别在于引入了上一时刻的信息。

4、反向传播过程


说明:下面对以上各式分别进行推导:






LSTM的前向过程,可以对线性的计算模块进行优化:


  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值