LSTM

本文详细介绍了LSTM模型的工作原理,通过图解展示了LSTM的结构,解析了其计算公式,并逐步解释了反向传播过程中如何计算各时刻的微分。通过一系列的数学推导,阐述了从t=T到t=1时刻的成本函数对隐藏状态的全微分,为深入理解LSTM的训练过程提供了指导。
摘要由CSDN通过智能技术生成

lstm_flowj (Fig. 1)

Fig.1 是一张展开的LSTM模型的示意图,绿色的模块表示隐藏层记忆单元,每个记忆单元都有三个输入,两个输出(虽然图中有三个输出箭头,但其中两个输出都是 h(t) ),因此, t 时刻记忆单元的输入、输出分别为 x(t),h(t1),s(t1) h(t),s(t)

differciate_chain_sh

模型的计算公式如下

g(t)i(t)f(t)o(t)s(t)h(t)=ϕ(Wgxx(t)+Wghh(t1)+bg)=σ(Wixx(t)+Wihh(t1)+bi)=σ(Wfxx(t)+Wfhh(t1)+bf)=σ(Woxx(t)+Wohh(t1)+bo)=g(t)i(t)+s(t1)f(t)=s(t)o(t)(Eq. 1.1)(Eq. 1.2)(Eq. 1.3)(Eq. 1.4)(Eq. 1.5)(Eq. 1.6)

成本函数的定义为:
L=t=1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值