【机器学习】神经网络及BP推导

最新推荐文章于 2024-05-15 09:45:24 发布

Chester-zZz

最新推荐文章于 2024-05-15 09:45:24 发布

阅读量3.7k

点赞数 4

分类专栏：机器学习文章标签：机器学习神经网络 BP 推导

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014433413/article/details/78440437

版权

参考 https://www.zybuluo.com/Feiteng/note/20154

1 前向传播

这里的推导都用矩阵和向量的形式，计算单个变量写起来太麻烦。矩阵、向量求导可参见上面参考的博客，个人觉得解释得很直接很好。

前向传播每一层的计算如下：

z (l + 1) = W (l, l + 1) a (l) + b (l, l + 1) (1.1)

$z^{(l+1)}=W^{(l,l+1)}a^{(l)}+b^{(l,l+1)} \tag{1.1}$

a (l + 1) = f (z (l + 1)) (1.2)

$a^{(l+1)}=f(z^{(l+1)}) \tag{1.2}$

$f$ 是激活函数。一般有sigmoid、tanh、relu等。

这里写图片描述

2 反向传播

为了得到好的模型，我们要更新参数 $W,b$ ，这里就用到了反向传播。

我们将神经网络的损失函数记为 $J(W,b)$ ，这里的 $W,b$ 是指网络中所有的参数。损失函数可以是均方误差、交叉熵等等。总之是衡量网络输出的结果与真实标记之间的差异。

之后，就要计算 $J(W,b)$ 对每一层 $W,b$ 的梯度，对 $W,b$ 进行更新。所有参数更新完成后，再进行前向传播。循环往复，直到达到要求为止。

反向传播之所以和正向传播这么对比着说，是因为反向传播也是一层一层地计算。首先看最后一层（假设最后一层没有激活）：

\partial J \partial W ( n - 1 , n ) = \partial J \partial z ( n ) \partial

最低0.47元/天解锁文章

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】神经网络及BP推导

神经网络及BP推导
复制链接

扫一扫

专栏目录

Chester-zZz CSDN认证博客专家 CSDN认证企业博客

码龄10年

34: 原创

24万+: 周排名

166万+: 总排名

11万+: 访问

: 等级

1139: 积分

36: 粉丝

70: 获赞

16: 评论

100: 收藏

私信

关注

热门文章

分类专栏

最新评论

【机器学习】支持向量机SVM原理及推导
glwjh 回复 Joker_joker: 看仔细了，1/2+（-1）=-1/2了，不是少了个1/2
关于RCNN中Bounding-box regression的个人理解
yingzijuntuan 回复 Gavin Ceng: 看到了一个解释，是说用log的形式，那么学习的参数范围就可以试负无穷到正无穷。假如没有log，那么参数都是正数。
关于RCNN中Bounding-box regression的个人理解
o_w_olf 回复提莫的AI成长之路: 高数里面的微分。你可以百度搜一下微分
关于RCNN中Bounding-box regression的个人理解
船桥: 感谢博主,"需要说明的是，得到d的输入并不是P这四个数，而是CNN pool5层的features，记为Φ5。这样，才不是“硬”拟合，如果只是输入P代表的四个数的话，那就是一个CNN外部的统计问题了"解决了我的困惑
关于RCNN中Bounding-box regression的个人理解
提莫的AI成长之路回复 Gavin Ceng: 我也想知道，这个公式原理是啥

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。