RNN概述
由于有些数据是与时间序列相关,是可以根据上文预测出下文的。
循环核具有记忆力,通过不同时刻的参数共享,实现了对时间序列的信息提取,
循环核的表示如上图所示, 我们可以设定记忆体的个数改变记忆容量,当记忆体的个数被指定输入Xt,输出Yt维度被指定,周围这些待训练参数的维度也就被限定了。记忆体内存储着每个时刻的状态信息ht,记忆体当前时刻存储的状态信息ht等于当前时刻的输入特征xt乘以矩阵Wxh,加上记忆体上一时刻存储的状态信息ht-1乘以矩阵Whh再加上偏置项bh,它们的和在经过tanh函数。当前时刻核的输出特征yt.记忆体内存储的状态信息ht乘以矩阵Why,再加上偏置by过softmax。其实这就是一层全连接。
- 在前向传播时,记忆体内存储的转态信息ht,在每个时刻都被刷新,三个参数矩阵wxh,whh,why自始至终都是固定不变的。
- 反向传播时:三个时拿出矩阵wxh,whh,why被梯度下降法更新
按照时间步展开就是把循环核按照时间轴方向展开,可以表示为如下所示: