Recurrent Neural Network regularization
简单回顾LSTM
照例先规定符号含义,我们此处默认指多层RNN网络。规定 h t l ∈ R n h^l_t\in{R^n} htl∈Rn表示第 l l l层 t t t时间步的因状态,维度为n,当 l = 0 l=0 l=0时, h t 0 h^0_t ht0表示 t t t时刻的外部输入;因为LSTM网络中使用全连接网络作为常规操作,全连接的数学表达为 W x + b Wx+b Wx+b,为了简洁起见,我们直接用一个映射变换 T n , m T_{n,m} Tn,m表示将一个 n n n维的输入映射为 m m m维的输出,即 R n → R m R^n{\rightarrow}R^m Rn→Rm; L L L是网络的层数, h t L h^L_t