神经网络学习笔记（七）

最新推荐文章于 2024-10-14 21:24:36 发布

dyc941126

最新推荐文章于 2024-10-14 21:24:36 发布

阅读量450

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dyc941126/article/details/45391933

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在前面几章中，我们介绍了随机梯度下降的框架和各个参数误差的求法，本章将在此基础之上介绍用于训练神经网络的反向传播算法。

一、反向传播算法（Backpropagation Algorithm）

回顾随机梯度算法的流程：

初始化各个参数 $\theta$ ， $\theta=\{w^{(1)},b^{(1)},...,w^{(L+1)},b^{(L+1)}\}$
循环 N 次
- 对于每一个训练样本 $(x^{(t)},y^{(t)})$
- 求目标函数的反梯度方向，即 $\Delta=-\nabla_\theta l(f(x^{(t)};\theta ),y^{(t)})-\lambda\nabla_\theta\Omega(\theta)$
- 更新参数 $\theta ←\theta+\alpha\Delta$
其中，一个很重要的过程就是如何求目标函数的反梯度方向。假定我们已经对神经网络进行了前向传播（即通过输入计算出了各层的预激励和激励，以及最终的误差函数），综合前面几张我们说的参数误差梯度的求法，我们有：
- 计算输出梯度
  - $\nabla_{a^{(L+1)}(x)}\log f(x)_y=-(\mathbf e(y)-f(x))$ ，详见第四章
- 对于 L+1 到 1 中的每一层k，有：
  - 计算隐层梯度
    $\nabla_{W^{(k)}}-\log f(x)_y=(\nabla_{a^{(k)}(x)}-\log f(x)_y)(h^{(k-1)}(x))^T$
    $\nabla_{b^{(k)}}-\log f(x)_y=\nabla_{a^{(k)}}-\log f(x)_y$
    详见第六章
  - 计算下一层激励梯度
    $\nabla_{h^{(k-1)}(x)}-\log f(x)_y=(W^{(k)})^T(\nabla_{a^{(k)}(x)}-\log f(x)_y)$ ，详见第五章
  - 计算下一层预激励梯度
    $\nabla_{a^{(k-1)}(x)}-\log f(x)_y=(\nabla_{h^{(k-1)}(x)}-\log f(x)_y)\odot[\cdots,g^\prime(a^{(k)}(x)),\cdots]$
    详见第五章
二、流图表示形式

1.前向传播

前向传播算法可以表示为如下图所示的一个无环图：

如图，从输入向量 $x$ 开始，我们可以根据其子节点计算当前节点中的值。例如，要计算 $a^{(1)}(x)$ ，则我们可以根据 $x$ 、 $W^{(1)}$ 以及 $b^{(1)}$ 等子节点进行计算。前向传播的最终目的是计算出各层的预激励和激励，以及最终的误差函数。根据上面对反向传播算法的描述，不难看出，前向传播是反向传播算法的必要步骤。

2.反向传播

我们的最终目的是求参数的误差梯度。根据上述方法，我们已经具备了求每一个参数 $\theta=\{w^{(1)},b^{(1)},...,w^{(L+1)},b^{(L+1)}\}$ 梯度的必要条件，只需从输出层开始，往下一层一层求各层参数梯度即可，故称为“反向传播”，其流图如下：

如图，此时我们从输出层开始，根据某节点的父节点计算该节点的梯度，过程在上面讲的很清楚，在此不再赘述。

三、梯度检验

梯度检验的作用是调试你的算法，确保BP算法正确。其原理如下：

∂f(x)∂x≈f(x+ϵ)−f(x−ϵ)2ϵ
其中：
- $f(x)$ 是误差函数
- $x$ 是待检验的参数
- $f(x+\epsilon)$ 是原参数值加上一个很小的数 $\epsilon$ 后的误差函数值
- $f(x-\epsilon)$ 是原参数值减去一个很小的数 $\epsilon$ 后的误差函数值

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。