长短期记忆
LSTM引入了3个门,输入门、遗忘门和输出门,以及与隐藏状态形状相同的记忆细胞。
输入门、遗忘门和输出门
长短期记忆的门中输入均为当前时间步输入 X t X_t Xt与上一时间步隐藏状态 H t − 1 H_{t-1} Ht−1,输出由激活函数为sigmoid函数的全连接层计算得到。所以这三个门元素的值域均为[0,1]。
时间步 t t t的输入门 I t ∈ R n × h I_t\in\R^{n\times h} It∈Rn×h、遗忘门 F t ∈ R n × h F_t\in\R^{n\times h} Ft∈Rn×h、输出门 O t ∈ R n × h O_t\in\R^{n\times h} Ot∈Rn×h分别计算如下:
I t = σ ( X t W