反向传播

作用
反向传播的作用就是计算网络的参数 w ∗ , b ∗ w^{*} ,b^{*} w,b反向传播并不是和梯度下降不同的训练方法,他与梯度下降相同,但是在计算梯度向量的时候更加高效。
链式法则
在这里插入图片描述

对整个网络有,其损失函数为: L ( θ ) = ∑ n = 1 N l n ( θ ) L(\theta ) = \sum_{n=1}^{N}l^{n}(\theta ) L(θ)=n=1Nln(θ),他是所有训练数据的损失之和。
在这里插入图片描述
把训练数据里的任意一个样本点输入 x n x^{n} xn到神经网络中,它会输出一个 y n y^{n} yn,把这个输出 y n y^{n} yn和样本点本身的标签target y n ^ \hat{y^{n}} yn^作一个交叉熵,这个交叉熵定义了输出值,和标签之间的距离 l n ( θ ) l^{n}(\theta ) ln(θ),如果交叉熵比较大,说明输出和标签之间距离较远,这个网络的参数的损失比较大,参数不好。
对所有的训练集损失进行求和,得到toal loss.这就作为损失函数。对损失函数的参数做偏微分得到:
在这里插入图片描述
以上图中被红色框标记的神经元为例,假设有两个输入 x 1 x_{1} x1, x 2 x_{2} x

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值