多分类交叉熵损失函数的梯度计算过程推导

Softmax函数公式:
在这里插入图片描述
Si 代表的是第i个神经元的输出
在这里插入图片描述
其中wij 是第i个神经元的第 j 个权重,b是偏移值。zi 表示该网络的第i个输出

隐藏层输出经过softmax:
在这里插入图片描述
具体过程如下图所示:
在这里插入图片描述
神经元输出结果
z4 = w1x1+w2x2+w3x3
z5 = w4
x1+w5x2+w6x3
z6 = w7x1+w8x2+w9*x3
经过softmax函数得到
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多分类损失函数公式:
在这里插入图片描述其中yi表示真实的分类结果

利用损失函数求梯度
在这里插入图片描述
在这里插入图片描述已知不做推导

求解书过程推导:
在这里插入图片描述
在这里插入图片描述
如果i等于j:
在这里插入图片描述
如果i不等于j:
在这里插入图片描述
在这里插入图片描述
针对分类问题,给定的结果yi 最终只会有一个类别是1,其他类别都是0,因此,对于分类问题,这个梯度等于:
在这里插入图片描述

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
交叉熵损失函数的反向传播可以使用链式法则进行推导。假设神经网络的输出为 $y_i$,真实标签为 $t_i$,则交叉熵损失函数为: $$ L = -\sum_i t_i \log y_i $$ 我们需要计算 $\frac{\partial L}{\partial y_i}$,再通过链式法则计算出其他参数的梯度。 首先,根据导数的定义,有: $$ \frac{\partial L}{\partial y_i} = -\frac{t_i}{y_i} $$ 接下来,我们需要计算 $\frac{\partial y_i}{\partial z_j}$,其中 $z_j$ 表示第 $j$ 个神经元的输入。根据 softmax 函数的定义,有: $$ y_i = \frac{e^{z_i}}{\sum_j e^{z_j}} $$ 当 $i=j$ 时有: $$ \frac{\partial y_i}{\partial z_i} = \frac{\partial}{\partial z_i} \frac{e^{z_i}}{\sum_j e^{z_j}} = \frac{e^{z_i} \sum_j e^{z_j} - e^{z_i} e^{z_i}}{(\sum_j e^{z_j})^2} = y_i (1 - y_i) $$ 当 $i \neq j$ 时有: $$ \frac{\partial y_i}{\partial z_j} = \frac{\partial}{\partial z_j} \frac{e^{z_i}}{\sum_j e^{z_j}} = -\frac{e^{z_i} e^{z_j}}{(\sum_j e^{z_j})^2} = -y_i y_j $$ 接下来,我们可以计算 $\frac{\partial L}{\partial z_j}$: $$ \frac{\partial L}{\partial z_j} = \sum_i \frac{\partial L}{\partial y_i} \frac{\partial y_i}{\partial z_j} = -\sum_i \frac{t_i}{y_i} y_i (1 - y_i) + \sum_{i \neq j} \frac{t_i}{y_i} y_i y_j = -t_j + y_j \sum_i t_i = y_j - t_j $$ 最后,根据链式法则,我们可以计算出其他参数的梯度: $$ \frac{\partial L}{\partial w_{jk}} = \frac{\partial L}{\partial z_j} \frac{\partial z_j}{\partial w_{jk}} = x_k (y_j - t_j) $$ $$ \frac{\partial L}{\partial b_j} = \frac{\partial L}{\partial z_j} \frac{\partial z_j}{\partial b_j} = y_j - t_j $$ 其中 $w_{jk}$ 表示第 $j$ 个神经元与第 $k$ 个输入之间的权重,$b_j$ 表示第 $j$ 个神经元的偏置。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值