反向传播

最新推荐文章于 2023-08-09 07:06:19 发布

weixin_45540546

最新推荐文章于 2023-08-09 07:06:19 发布

阅读量224

点赞数 1

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45540546/article/details/109572057

版权

作用
反向传播的作用就是计算网络的参数 $w^{*} ,b^{*}$ 反向传播并不是和梯度下降不同的训练方法，他与梯度下降相同，但是在计算梯度向量的时候更加高效。
链式法则
在这里插入图片描述

对整个网络有，其损失函数为： $L(\theta ) = \sum_{n=1}^{N}l^{n}(\theta )$ ,他是所有训练数据的损失之和。
在这里插入图片描述
把训练数据里的任意一个样本点输入 $x^{n}$ 到神经网络中，它会输出一个 $y^{n}$ ，把这个输出 $y^{n}$ 和样本点本身的标签target $\hat{y^{n}}$ 作一个交叉熵，这个交叉熵定义了输出值，和标签之间的距离 $l^{n}(\theta )$ ，如果交叉熵比较大，说明输出和标签之间距离较远，这个网络的参数的损失比较大，参数不好。
对所有的训练集损失进行求和，得到toal loss.这就作为损失函数。对损失函数的参数做偏微分得到：
在这里插入图片描述
以上图中被红色框标记的神经元为例，假设有两个输入 $x_{1}$ , $x_{2}$

最低0.47元/天解锁文章

weixin_45540546

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
反向传播

作用反向传播的作用就是计算网络的参数w∗,b∗w^{*} ,b^{*}w∗,b∗反向传播并不是和梯度下降不同的训练方法，他与梯度下降相同，但是在计算梯度向量的时候更加高效。链式法则对整个网络有，其损失函数为：L(θ)=∑n=1Nln(θ)L(\theta ) = \sum_{n=1}^{N}l^{n}(\theta )L(θ)=∑n=1Nln(θ),他是所有训练数据的损失之和。把训练数据里的任意一个样本点输入xnx^{n}xn到神经网络中，它会输出一个yny^{n}yn，把这个输出yny^{n
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。