机器学习-反向传播（backpropagation）

Big.M.LY

于 2024-02-24 21:20:11 发布

阅读量389

点赞数 7

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinfeisizui/article/details/136274432

版权

在学习Batch Normalization时有遇到在反向传播时更新权重的问题，为了进一步理解Batch Normalization的具体过程，在此再详细理解一下反向传播（backpropagation）。

前向传播

在理解反向传之前先大致过一遍前向传播。

一般网络前向传播过程如上图所示，第一层是偏置项和输入，中间层是隐藏层，最后是输出。其中函数g代表代价函数，ω为的权重，z代表加权和。而在这张图中的a1(3)代表最终的预测值。如果是多分类问题则会有多个输出。我们从第一层开始正向一层一层进行计算，直到最后一层的a1(3)。
这时我们就能得到预测结果和真实值的偏差δ。为了使δ越小越好，我们可以通过求偏导的方式从最后一层向前一层依次求偏导，找到网络中对δ影响较大的权重，并调整该权重的值，从而使δ变小。这个过程便称之为反向传播。

反向传播

如下图蓝色所示为反向传播过程
在这里插入图片描述
其中y代表真实值，δ为每一层的偏差值。δ1(3)为y与a1(3)的偏差值，每一层的偏差值也如上图中所示的计算公式所示。
反向传播求导
例如，为了计算δ1(3)对ω11(1)的敏感度，即ω11(1)对δ1(3)的作用强度，如上图所示。我们可以通过类似于上图中的链式求导法则一层一层算出预测值对于每个权重的敏感度，从而合理的改变这些权重，使得预测值更接近真实值。

关注

7
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
机器学习-反向传播（backpropagation）

在学习Batch Normalization时有遇到在反向传播时更新权重的问题，为了进一步理解Batch Normalization的具体过程，在此再详细理解一下反向传播（backpropagation）。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。