反向传播算法（back propagation）

最新推荐文章于 2024-09-22 22:13:16 发布

codedrinker

最新推荐文章于 2024-09-22 22:13:16 发布

阅读量819

点赞数 3

分类专栏：算法操作系统文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunjinbat/article/details/107672683

版权

算法同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

2 篇文章 1 订阅

订阅专栏

深度学习小白一枚（才起步），之前是做软件开发，读研转CV方向。帖子上的关于反向传播算法写的都很迷，自己想总结一下反向传播算法（back propagation）。

需要的数学知识有：1、线性代数（矩阵求导）

2、高等数学（链式求导法则）

反向传播算法，顾名思义，肯定有正向传播，forward propagation 算法。

forward propagation 就是在神经网络中上一层的输出作为输入乘上权重矩阵W加上偏置b（后面通过梯度下降bp算法要修改W、b）得到新的输出。

这里举逻辑回归的例子，z是隐藏层，加上激活函数后得到a，以及定义了损失函数loss function（极大似然法得到）。

下面是前向传播各层的值。

但是这些权重和偏置不是我们最终想要的，因此要优化损失函数，得到使损失函数最小的那组权重和偏置。因此需要对损失函数进行back propagation。

(这里为了书写方便，将偏倒写成微分d的形式意思目明白就行)

这里以单层传播为例，从最后一层计算dL/da，微积分知识得到：

dL/da = -y/a+(1-y)/(1-a)

dL/dz = dL/da * da/dz = [-y/a+(1-y)/(1-a) ]*[a(1-a)] = a - y

dL/dw = dL/dz * dz*dw = a * dL/dz

dL/db = dL/dz * dz*db = dL/dz（后面的层以此类推）

然后再gradient descent：(lr表示学习率)

repeat:

w := w - lr*dL/dw

b := b - lr*dL/db

这样最后得到的w和b就是使loss function最小的一组值。下图是恩达大哥的手写笔记一个道理。

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。