RNN 循环神经网络
RNN主要处理有时序关系的变长序列问题。每个神经元在每一时刻都一个特殊的hidden状态h(t),由当前节点的输入I(t)和上一时刻t-1隐藏状态h(t-1)加权求和后经过一个非线性激活函数得到,具体表示成公式如下:
每个神经元t时刻隐状态
参数Whh决定了当前神经元以多少比例接受之前所有时刻[0,t-1]的输入信息
阻碍RNN发展的两个严重问题是:梯度爆炸 和 梯度消失、
RNN的对隐状态h(0)进行反向传播:
利用RNN时序上的依赖关系对上式进行展开,得到(注意,下式成立的前提是激活函数简化为线性函数):
继续对