多分类交叉熵损失函数的梯度计算过程推导

最新推荐文章于 2025-04-02 22:17:32 发布

baihaisheng

最新推荐文章于 2025-04-02 22:17:32 发布

阅读量5.8k

点赞数 4

分类专栏：深度学习 NLP 文章标签：自然语言处理神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41128383/article/details/106091429

版权

NLP 同时被 2 个专栏收录

88 篇文章

订阅专栏

22 篇文章

订阅专栏

Softmax函数公式：
在这里插入图片描述
S_i 代表的是第i个神经元的输出

其中w_ij 是第i个神经元的第 j 个权重，b是偏移值。z_i 表示该网络的第i个输出

隐藏层输出经过softmax：
在这里插入图片描述
具体过程如下图所示：

神经元输出结果
z4 = w1x1+w2x2+w3x3
z5 = w4x1+w5x2+w6x3
z6 = w7x1+w8x2+w9*x3
经过softmax函数得到

多分类损失函数公式：
在这里插入图片描述其中y_i表示真实的分类结果

利用损失函数求梯度
在这里插入图片描述
已知不做推导

求解书过程推导：
在这里插入图片描述

如果i等于j：

如果i不等于j：

针对分类问题，给定的结果y_i 最终只会有一个类别是1，其他类别都是0，因此，对于分类问题，这个梯度等于：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。