(Fig. 1)
Fig.1 是一张展开的LSTM模型的示意图,绿色的模块表示隐藏层记忆单元,每个记忆单元都有三个输入,两个输出(虽然图中有三个输出箭头,但其中两个输出都是 h(t) ),因此, t 时刻记忆单元的输入、输出分别为
模型的计算公式如下:
g(t)i(t)f(t)o(t)s(t)h(t)=ϕ(Wgxx(t)+Wghh(t−1)+bg)=σ(Wixx(t)+Wihh(t−1)+bi)=σ(Wfxx(t)+Wfhh(t−1)+bf)=σ(Woxx(t)+Wohh(t−1)+bo)=g(t)∗i(t)+s(t−1)∗f(t)=s(t)∗o(t)(Eq. 1.1)(Eq. 1.2)(Eq. 1.3)(Eq. 1.4)(Eq. 1.5)(Eq. 1.6)
成本函数的定义为:
L=∑t=1