LSTM
全称:Long Short-Term Memory 长短期记忆网络
大致结构如图所示(不想用软件画图。。。):
三个门已经在图中表示了出来。下面将逐步介绍。
图中最上面的C是最主要的传输流。
遗忘门:
f t = δ ( W f ⋅ [ h t − 1 , X t ] ) f_t = \delta(W_f\cdot[h_{t-1},X_t]) ft=δ(Wf⋅[ht−1,Xt])(这里b放入了 X t X_t Xt中)
输出值在[0,1]之间。和 C t − 1 C_{t-1} Ct−1相乘,代表保留 C t − 1 C_{t-1} Ct−1中多少信息。
1代表完全保留,0代表完全舍弃。
输入门:
<