08.7. 通过时间反向传播

最新推荐文章于 2024-03-09 17:01:36 发布

nsq_ai

最新推荐文章于 2024-03-09 17:01:36 发布

阅读量261

点赞数 1

分类专栏： # dive_into_deep_learning python书籍笔记 Python基础学习文章标签：深度学习 python 机器学习

本文链接：https://blog.csdn.net/weixin_45063703/article/details/127238969

版权

123 篇文章 17 订阅

订阅专栏

78 篇文章 4 订阅

订阅专栏

69 篇文章 0 订阅

订阅专栏

通过时间反向传播（backpropagation through time，BPTT） [Werbos, 1990]实际上是循环神经网络中反向传播技术的一个特定应用。

完全计算：
这样的计算非常缓慢，并且可能会发生梯度爆炸，因为初始条件的微小变化就可能会对结果产生巨大的影响。
截断时间步
通常被称为截断的通过时间反向传播 [Jaeger, 2002]。这样做导致该模型主要侧重于短期影响，而不是长期影响。这在现实中是可取的，因为它会将估计值偏向更简单和更稳定的模型
随机截断
导致了不同长度序列的加权和，其中长序列出现的很少，所以将适当地加大权重
比较策略

比较RNN中计算梯度的策略，3行自上而下分别为：随机截断、常规截断、完整计算

为了在循环神经网络的计算过程中可视化模型变量和参数之间的依赖关系，我们可以为模型绘制一个计算图，
在这里插入图片描述

上图表示具有三个时间步的循环神经网络模型依赖关系的计算图。未着色的方框表示变量，着色的方框表示参数，圆表示运算符

关注