D. 深度学习 — 递归神经网络 数据缓存 Elman Network:缓存的是 hidden layer 的值Jordan Network:缓存的是 output layer 的值 网络结构 RNN 问题:Total Loss是波动的,不是平滑下降的 原因 参数(Weight)对Total Loss 是陡峭的 解决思路 Clipping,针对权重设置上限 Bidirectional RNNLong Short-term Memory(LSTM) input 输入值输入门遗忘门输出门 优势 解决梯度消失