我们首先来看看RNN的网络结构,如下图所示 xt 表示第t,t=1,2,3…步(step)的输入 st 为隐藏层的第t步的状态,它是网络的记忆单元。 st=f(u×xt+w×st−1) ,其中f一般是非线性的激活函数