反向传播：公式推导篇

最新推荐文章于 2023-03-15 09:58:40 发布

Stealers

最新推荐文章于 2023-03-15 09:58:40 发布

阅读量594

点赞数 2

分类专栏：人工智能 # 深度学习：原理篇文章标签：深度学习人工智能机器学习

本文链接：https://blog.csdn.net/qq_40661327/article/details/104339629

版权

人工智能同时被 2 个专栏收录

9 篇文章 2 订阅

订阅专栏

深度学习：原理篇

2 篇文章 0 订阅

订阅专栏

反向传播：公式推导篇

概述

本节推导了一个两层的全连接层的正向传播公式以及反向传播公式。虽然只是用一个两层的全连接层举例，各层也只取了一个参数作为推导，但我觉得阅读下来大家还是能对神经网络的正向传播、反向传播以及参数更新产生更深刻的理解。本节只是公式推导篇，欢迎阅读另一篇反向传播：代码演示篇

正文

网路构架如下图所示，接下来给大家推导反向传播过程以及参数是如何更新的。
在这里插入图片描述
该网络包括一个输入层，一个隐含层，一个输出层。这里损失函数L我们使用均方差损失函数。我们可以很快得出正向传播公式，其中σ()指Sigmoid激活函数。

隐藏层到输出层的参数的偏导数

这里取 $W_{2}$ 中的 $w_{ni}$ 参数作为举例推导。
观察正向传播公式，参数 $w_{ni}$ 这一列最开始与 $H$ 相乘，得到 $g_{i}$ ， $g_{i}$ 与 $G_{i}$ 关联， $G_{i}$ 与 $L_{i}$ 关联，所以这里求和符号可以去掉。以下是公式推导：
在这里插入图片描述

输入层到隐藏层的参数的偏导数

这里取 $W_{1}$ 中的 $w_{mn}$ 参数作为举例推导。
观察正向传播公式，参数 $w_{mn}$ 最开始与 $h_{n}$ 关联， $h_{n}$ 与 $H_{n}$ 关联，而 $H_{n}$ 跟 $W_{2}$ 相乘后与整个 $g$ 关联，整个 $g$ 与整个 $G$ 关联，整个 $G$ 跟整个 $L$ 关联，所以在这里求和符号不可以去掉。以下是公式推导：
在这里插入图片描述

这些参数是如何更新的

现在我们有了这些参数的偏导数，我们就可以通过梯度下降法更新参数了：
α就是我们常说的学习率。

在这里插入图片描述

为什么梯度下降法是有效的？

引用知乎@老董的答案

Stealers

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
反向传播：公式推导篇

反向传播：公式推导篇概述正文进阶例子拓展升华概述本文为读《TensorFlow深度学习》第七章的笔记。参考资料：龙龙老师的新书《TensorFlow深度学习》GitHub地址：教材+源码正文接下来我们将通过公式推导下图网络构架（图来自原书）的反向传播过程以及参数是如何更新的。该网络包括一import tensorflow as tf定义这个函数def f(x): re...
复制链接

扫一扫