计算机视觉中的深度学习6: 反向传播

SuPhoebe

于 2020-08-24 08:53:38 发布

阅读量476

点赞数

分类专栏：机器学习与数学模型

本文链接：https://blog.csdn.net/u013007900/article/details/108192198

版权

68 篇文章 137 订阅

订阅专栏

Slides：百度云提取码: gs3n

我们之前在学习线性分类器的时候，使用Loss函数以及梯度下降法来更新权重。那么对于神经网络，我们该如何计算每层神经元的权重呢？

在这里插入图片描述
如上公式所示，Loss函数最终是能被表达成由各层W组成的函数公式，并且也完全有可能直接对其进行求导。

问题

公式 $f (x, y, z) = (x + y) z$ 的计算图如下
在这里插入图片描述

向前传播过程
1. $x+y\ \ , \ f=qz$
反向传播过程
1. 我们想要的是 $\partial f\over \partial x$ , $\partial f\over \partial y$ , $\partial f\over \partial z$
3. 用链式规则可以得到如下的公式
4. 同理对于 $\partial f\over \partial x$ ，我们是很容易能够得出对于当前节点位置的偏导是什么的

公式为
$f(x,w)={1\over 1+e^{-(w_0x_0+w_1x_1+w_2)}}$

向前传播过程
在这里插入图片描述
反向传播的第一部分

$-{1\over 1.37^2}$
在这里插入图片描述
反向传播的第三步

$0.2 = e^{-1.0} * -0.53$
在这里插入图片描述

这个例子就非常具体地显示了怎么计算本地梯度以及连式法则的运用。

对于每一个神经层，在实现这个神经层的时候，都会知道输入输出的矩阵长宽，以及激活函数的使用。所以在pytorch，tensorflow等实现的时候，都已经实现好了这个激活函数和输入输出矩阵的节点向前传播，向后传播的函数，直接将这个节点拿去使用即可。

在这里插入图片描述

在这里插入图片描述
第一例为单输入单输出，第二列为输入向量，输出单数，第三列为输入输出向量

对于一个4输入4输出的函数，我们可以得出它的Jacobian矩阵如下
在这里插入图片描述
我们可以发现，Jacobian矩阵大部分都是0；这是一个非常常见的情况，Jacobian矩阵是非常非常稀疏的，所以绝对不要显式地表示Jacobian矩阵，而是应该用隐式的方式去压缩。

矩阵输入，矩阵输出，感兴趣的可以看看幻灯片里面的具体讲解
在这里插入图片描述

关注

专栏目录