本节将介绍另一种常⽤的⻔控循环神经网络:长短期记忆(long short-term memory,LSTM)。它⽐⻔控循环单元的结构稍微复杂一点。
目录
1. 长短期记忆
LSTM 中引⼊了3个门,即输入门(input gate)、遗忘门(forget gate)和输出门(output gate),以及与隐藏状态形状相同的记忆细胞(某些文献把记忆细胞当成⼀种特殊的隐藏状态),从⽽记录额外的信息。
- 输入门、遗忘门和输出门
与⻔控循环单元中的重置门和更新门一样,如下图所示,⻓短期记忆的⻔的输⼊均为当前时间步输⼊与上一时间步隐藏状态,输出由激活函数为sigmoid函数的全连接层计算得到。如此一来,这3个门元素的值域均为[0,1].
具体来说,假设隐藏单元个数为h,给定时间步t的⼩批量输⼊(样本数为d,输入个数为d)和上⼀时间步隐藏状态.时间步t的输⼊⻔、遗忘门和输出门分别计算如下:
其中的是权重参数,是偏差参数。
- 候选记忆细胞