动手学深度学习PyTorch——正向传播反向传播学习笔记

最新推荐文章于 2022-09-18 18:46:26 发布

卡塞尔学院临时校长

最新推荐文章于 2022-09-18 18:46:26 发布

阅读量456

点赞数

分类专栏：动手学深度学习pytorch笔记文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43901214/article/details/104541429

版权

动手学深度学习pytorch笔记专栏收录该内容

9 篇文章 2 订阅

订阅专栏

学习问题总结（有关FP、BP、CG）

问题一

个人觉得github上讲得不错的BP算法点这里

问题二

正向传播就是沿着从输入层到输出层的顺序，依次计算并存储神经网络的中间变量，so easy！反向传播就是沿着从输出层到输入层的顺序，依次计算并存储神经网络中间变量和参数的梯度。indigestibility ？

我理解的就是对复合函数求偏导呗，不管函数多么复杂，其实都是层层相套，堆叠在一起，就比如要函数Z对最里层的变量x求偏导，用的不也是链式求导吗，Z先对次外层变量u求偏导，其值再乘以u对次次外层变量y的偏导，以此类推，相乘即可。

问题三

在pytorch中真正用的时候直接通过autograd模块调用backward函数计算梯度。

问题四

给一个Tensor属性.requires_grad设置为True之后，就能track它的各种操作，一顿哈赛之后，直接.backward() ，链式求导，完成所有梯度计算，Tensor的梯度会累积到.grad属性中。

问题五

backword用的时候需要注意一点：在y.backward()时，如果y是标量，则不需要为backward()传入任何参数；否则，需要传入一个与y同形的Tensor。所以使用时直接捣鼓成标量得了，这也是为什么backword之前都会sum一下。简单解释看下边吧，详细解释可以参考知乎回答（PyTorch 的 backward 为什么有一个 grad_variables 参数？）

为了避免向量（甚至更高维张量）对张量求导，而转换成标量对张量求导。我们不允许张量对张量求导，只允许标量对张量求导，求导结果是和自变量同形的张量，所以必要时我们要把张量通过将所有张量的元素加权求和的方式转换为标量。