先聊聊潜变量自回归模型
使用潜变量h_t总结过去信息
![在这里插入图片描述](https://img-blog.csdnimg.cn/2d6fadcd3133488fa45b7197b26382c8.png)
此时的h_t与h_t-1和x_t-1相关,x_t与h_t和x_t-1相关
循环神经网络
![在这里插入图片描述](https://img-blog.csdnimg.cn/b70cd5ab34a34f9b80f875d04e755228.png)
Whh存放所有的时序信息
此时h_t与h_t-1和x_t-1相关
使用循环神经网络的语言模型
![在这里插入图片描述](https://img-blog.csdnimg.cn/9f48bf9ee3a94845a25a3bc0d2856288.png)
输入"你",计算生成隐变量,通过隐变量预测输出"好"
预测x_t的时候,是没有看到x_t的,即输出要在当前输入之前
困惑度(perplexity)
![在这里插入图片描述](https://img-blog.csdnimg.cn/b53c3af5eff24ed8aa076dd40775499b.png)
梯度剪裁
![在这里插入图片描述](https://img-blog.csdnimg.cn/2e8d90c52b9f40fb9341a2a998c4e90e.png)
RNN应用
![在这里插入图片描述](https://img-blog.csdnimg.cn/6e42f7d709bb4a089dd7d716eba4d793.png)
总结
1.循环神经网络的输出取决于当下输入和前一时间的隐变量
2.应用到语言模型中时,循环神经网络根据当前词预测下一时刻词
3.通常使用困惑度来衡量语言模型的好坏