简单阐述一下BP的过程？

最新推荐文章于 2024-08-06 11:45:10 发布

zone_chan

最新推荐文章于 2024-08-06 11:45:10 发布

阅读量1.2k

点赞数

文章标签：网络深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38646522/article/details/116765822

版权

1.基本概念

BP(Back Propogation)算法是一种最有效的学习方法，主要特点是信号前向传递，而误差后向传播，通过不断调节网络权重值，使得网络的最终输出与期望输出尽可能接近，以达到训练的目的。前向过程中通过与正确标签计算损失，反向传递损失，更新参数，优化至最后的参数。

而面试的过程中，我们可以拿出一支笔，给面试官直接说，“老师，我来直接写一个吧，您看看呗？”

“你看哈，我这一个两层的神经网络。其中 $x$ 是网络的输入， $y$ 是网络的输出， $w$ 是网络学习到的参数。"

“在这里， $w$ 的值就是我们需要更新的目标，但是我们只有一些 $x$ 与跟它对应的真实 $y = f (x)$ 的值，所以呢？我们需要使用这两个值来计算 $w$ 的值了，整个问题就转变成了下面的优化问题了，也就是我们需要求函数的最小值。”

在实际中，这类问题有一个经典的方法叫做梯度下降法。意思是我们先使用一个随机生成的 $w$ ，然后使用下面的公式不断更新 $w$ 的值，最终逼近真实效果。

$w^{+}=w-\eta \cdot \frac{\partial E}{\partial w}$

这里 $w$ 是一个随机初始化的权重， $\frac{\partial E}{\partial w}$ 是表示当前误差对权重 $w$ 的梯度。 $\eta$ 是表示的学习率，通常不会很大，都是0.01以下的值，用来控制更新的步长。

2. BP基础之链式求导

若 $y = g (x)$ , $z = f (y)$ ,那么 $z = h (x)$ ,其中 $\circ g$ 。其中 $\frac{d y}{d x}=g^{\prime}(x), \frac{d z}{d y}=f^{\prime}(y)$ 。

当我们需要求 $z$ 对 $x$ 的导数 $\frac{d z}{d x}$ 就需要使用链式求导了。根据我们之前学过的知识：

$h^{\prime}(x)=\frac{d z}{d x}=\frac{d z}{d y} \cdot \frac{d y}{d x}$

这里说的都还是以单变量作为例子，实际中，多维变量就是变成了求偏导数了。

OK！基本上面试的时候，答到这个份儿上了，就已经够了！！

3. 参考

https://blog.csdn.net/qq_43196058/article/details/102670461
https://zhuanlan.zhihu.com/p/40378224
https://zhuanlan.zhihu.com/p/21407711

大家好，我是灿视。目前是位算法工程师 + 创业者 + 奶爸的时间管理者！

我曾在19，20年联合了各大厂面试官，连续推出两版《百面计算机视觉》，受到了广泛好评，帮助了数百位同学们斩获了BAT等大小厂算法Offer。现在，我们继续出发，持续更新最强算法面经。
我曾经花了4个月，跨专业从双非上岸华五软工硕士，也从不会编程到进入到百度与腾讯实习。
欢迎加我私信，点赞朋友圈，参加朋友圈抽奖活动。如果你想加入<百面计算机视觉交流群>，也可以私我。在这里插入图片描述

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。