目录
门控循环单元GRU
RNN不能处理太长的序列,因为序列信息都放在隐藏状态里面,就类似一个带时间序列的MLP, 当时间很长的时候,隐藏状态里累计了太多东西,前面很久的信息就不那么有参考价值了。
因此,观察一个序列时,不是每个观察值同样重要。
而门控循环单元的作用就是通过一些额外的控制单元,选取比较重要的数据内容用来训练循环神经网络。可以通过R和Z的大小,来选择多看现在的Xt还是多看过去隐藏状态Ht-1.
门控循环单元的组成
1、Rt重置门(reset gate)和Zt更新门(update gate)。 我们把它们设计成(0,1)(0,1)区间中的向量, 这样我们就可以进行凸组合。重置门Rt是计算新的隐藏状态时需要多少之前的隐藏状态的信息;更新门Zt是计算新的隐藏状态时,需要多少新的关于Xt的信息。