目录 传统语言模型 循环神经网络语言模型 损失函数 训练RNN时的困难 梯度消失问题 梯度消失实例 防止梯度爆炸 减缓梯度消失 困惑度结果 问题:softmax太大且太慢 一个实现技巧 序列模型的应用 双向和深层RNNs 双向RNNs