反向传播(Backpropagation)算法详解

最新推荐文章于 2024-08-30 09:24:02 发布

Flyingzhan

最新推荐文章于 2024-08-30 09:24:02 发布

阅读量2w

点赞数 5

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Flyingzhan/article/details/83748463

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

反向传播(back propagation)算法详解

反向传播算法是神经网络的基础之一，该算法主要用于根据损失函数来对网络参数进行优化，下面主要根据李宏毅机器学习课程来整理反向传播算法，原版视频在https://www.bilibili.com/video/av10590361/?p=14.

首先，我们来看一看优化方程：

上面的损失函数是普通的交叉熵损失函数，然后加上了正则化项，为了更新参数W，我们需要知道J关于W的偏导。

上图是一个简单的例子，我们截取神经网络的一部分，根据链式法则(chain rule),要想知道J关于w的偏导，我们需要求出：

上面的式子也可以写成下式，a代表activation function也就是激活函数：

1:前向传播（forward pass）

在前向传播中，我们可以得到每个神经元的输出z，以及z关于该层参数w的偏微分：

根据z的式子我们可以知道，z关于w的偏导等于该层的输入，下图是一个例子:

2:反向传播(backward pass)

通过正向传播，我们已经知道了但是还没有求出来，而这两项都是在反向传播过程中得到的。

其中比较好求，因为它的值就是激活函数的偏导，比如sigmoid函数的偏导等于z(1-z).因此现在我们只需要求解：

根据链式法则，等于所有分支关于a的偏导，如上图所示。

因此求解的过程大致如下：

为了求，我们需要求解，如果直接连接输出的话，可以按照下面求解：

如果不是直接输出，那么就递归的求解。

下面就是总的过程：

可以看出，在求解偏导的时候，需要乘以每一层的输出z，以及激活函数的导数，以及中间的参数w，因此在训练神经网络的时候需要做batch normalization，使得每一层的输入大致在一个scale下面，另外还需要加正则项防止w过大（会造成梯度爆炸），除此之外还需要设计一些好的激活函数来防止梯度消失问题(如sigmoid的偏导最大值为0.25，因此层数加深之后会造成梯度消失）。

关注

5
点赞
踩
66

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Flyingzhan CSDN认证博客专家 CSDN认证企业博客

码龄9年

27: 原创

40万+: 周排名

46万+: 总排名

12万+: 访问

: 等级

1447: 积分

32: 粉丝

65: 获赞

43: 评论

339: 收藏

私信

关注

热门文章

分类专栏

最新评论

跨模态检索评价指标(evaluations of cross-modal retrieval)
极~至: 博主你好，有没有像你这样介绍recall@K指标的代码
基于树结构的机器学习模型
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)使用更多的站内链接。
tSNE
weixin_51646584: 您好，这个可以修改颜色吗
跨模态检索评价指标(evaluations of cross-modal retrieval)
m0_57287577: 你好！再次非常感谢你回答我绘制PR曲线的问题。想再请教一下你有PRDH这篇文章的代码吗？我在网上找了好久都没找到
跨模态检索评价指标(evaluations of cross-modal retrieval)
m0_57287577: 非常感谢你！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。