RNN
首先来看一下经典的RRN的结构图,这里 x x x 是输入 W W W 是权重矩阵 (RNN的权重矩阵是共享的所以都是W) h h h 是隐藏状态 y y y是输出
RNN简单公式定义
h t = W ∗ f ( h t − 1 ) + W ( h x ) ∗ x [ t ] h_t = W*f(h_{t-1}) + W^{(hx)}*x_{[t]} ht=W∗f(ht−1)+W(hx)∗x[t]
y t = W ( S ) ∗ f ( h t ) y_{t} = W^{(S)}*f(h_t) yt=W(S)∗f(ht)
其中, h t h_t ht表示 t 时刻的隐藏状态 x [ t ] x_{[t]} x[t] 表示 t 时刻的输入 y t y_t yt 表示 t 时刻的输出。我们记总体的error为 E E E 那么 E E