深度学习与计算机视觉[CS231N] 学习笔记（4.1）：反向传播（Backpropagation）

最新推荐文章于 2024-01-27 01:02:32 发布

ZeroZone零域

最新推荐文章于 2024-01-27 01:02:32 发布

阅读量963

点赞数

分类专栏：计算机视觉文章标签：反向传播图像分类计算机视觉深度学习

本文链接：https://blog.csdn.net/ksws0292756/article/details/79034581

版权

计算机视觉专栏收录该内容

26 篇文章 15 订阅

订阅专栏

在学习深度学习的过程中，我们常用的一种优化参数的方法就是梯度下降法，而一般情况下，我们搭建的神经网络的结构是：输入→权重矩阵→损失函数。如下图所示。
这里写图片描述
而在给定输入的情况下，为了使我们的损失函数值达到最小，我们就需要调节权重矩阵，使之满足条件，于是，就有了本文现在要介绍的深度学习中的一个核心方法——反向传播。

光听名字可能不太好理解，下面我们用一个简单的例子来讲解反向传播是如何工作的（了解高数中求导的链式法则有助于理解该方法）。
如下图所示，首先定义一个简单的函数，它具有3个自变量 $x,y,z$ ，接着，定义中间变量 $q=x+y$ ，然后令 $q$ 分别对 $x,y$ 求导，令 $f$ 分别对 $z,q$ 求导。而我们的最终目的是要求出 $f$ 对 $x,y,z$ 的导数。有的同学可能会疑惑，为什么要这么麻烦，为什么不能直接求导呢？请注意，这里我们觉得麻烦是因为当前使用的函数一个十分简单的形式，因此我们会觉得这种方法显得繁杂，但当我们遇到的函数形式十分复杂（大多数情况确实如此）时，反向传播方法可以有效的帮助我们求得所需的导数。
这里写图片描述

要使用反向传播方法，我们首先获取一组给定的样本值，如下图所示，假设为 $x=-2,y=5,z=-4$ ，由此我们可以通过计算得出 $q=3,f=-12$ 。接下来，我们首先求 $f$ 对自身的导数，等于1（图中红色数字为导数值），然后我们再分别求 $f$ 对 $q和z$ 的导数，分别等于 $z和q$ ，即-4和3，接着，再根据链式法则求得 $f对x和y$ 的导数，均为 $(-4*1)$ 。

这里写图片描述
反向传播的运算流程可以用下面这幅图来描述，首先是顺着绿色的箭头计算出相应的变量并存储起来，然后再顺着红色的箭头算出我们需要的梯度值。

这里写图片描述
为了说明这种方法确实很有用，我们再列举另一个比较复杂的函数例子。如下图所示，我们首先给出函数的具体形式，并计算相应的中间变量和结果变量。

这里写图片描述
接着，我们根据反向传播的规则和链式法则求出每一个变量对应的梯度值，具体如下图所示。

这里写图片描述
从这里我们可以看出，如果不使用反向传播方法而直接去计算梯度的话，过程将会变得十分麻烦，更何况实际中我们使用的函数还要更加复杂！

ZeroZone零域

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习与计算机视觉[CS231N] 学习笔记（4.1）：反向传播（Backpropagation）

在学习深度学习的过程中，我们常用的一种优化参数的方法就是梯度下降法，而一般情况下，我们搭建的神经网络的结构是：输入→权重矩阵→损失函数。如下图所示。而在给定输入的情况下，为了使我们的损失函数值达到最小，我们就需要调节权重矩阵，使之满足条件，于是，就有了本文现在要介绍的深度学习中的一个核心方法——反向传播。光听名字可能不太好理解，下面我们用一个简单的例子来讲解反向传播是如何工作的（了解高
复制链接

扫一扫

专栏目录