Softmax、交叉熵损失、KL散度、多类支撑向量机损失

dreamingcoder

已于 2023-09-01 10:55:58 修改

阅读量240

点赞数

分类专栏：深度学习文章标签：机器学习深度学习人工智能

于 2023-04-28 20:27:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_55019159/article/details/130434077

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章讲述了在多分类任务中，Softmax函数如何将神经网络的输出转换为概率分布，并介绍了交叉熵损失作为评估预测与真实分布差异的函数，以及它与KL散度的关系。在one-hot编码的真实分布情况下，交叉熵损失等同于KL散度，常被用作损失函数来优化模型。相比之下，多类支撑向量机损失关注的是正确类别与其他类别的分数差距。

摘要由CSDN通过智能技术生成

Softmax

在多分类任务中，神经网络最后一层计算的输出是每个类别的预测分数，为了让使模型输出每个类的概率，Softmax操作子对预测分数求指数，然后归一化。

交叉熵损失与KL散度

交叉熵损失是分类任务中的一种损失函数，用来衡量预测值和真实值这两个分布之间的差异程度。我们先来看几个概念，再来理解交叉熵损失。

假设向量 p 是Softmax之后的预测分布，向量 y 是真实分布，其中 p_i，y_i 分别是第i个类别的预测分数和真实分数，则：

熵： $H(y)=-\sum_iy_ilog(y_i)$
交叉熵： $H(y,p)=-\sum_iy_ilog(p_i)$
相对熵： $KL(y||p)=-\sum_iy_ilog\frac{p_i}{y_i}$ ，又叫KL散度，度量两个分布之间的不相似性，由于不具有交换性，所以不能叫距离

经过公式推导不难得出三者之间有这样的关系： $H (y, p) = H (y) + K L (y ∣∣ p)$ 。由于分类任务中，真实分布为one-hot形式，即向量y为类似[0,0,1,0,0]^T的样子，因此我们能得到以下两点：

（1）H(y)=0，所以 $H (y, p) = K L (y ∣∣ p)$

（2） $H(y,p)=-log(p_i)$ ，其中i为真实类别

衡量预测值和真实值之间的距离本质上应该使用相对熵，但是由于上面我们已经证明，在y为one-hot形式下，相对熵等于交叉熵，所以我们就直接用更简单的交叉熵作为损失函数，即公式（2）。当真实分布y不是one-hot形式时，就不能使用交叉熵损失。

交叉熵损失 vs 多类支撑向量机损失

多类支撑向量机损失要求预测结果中，正确类别的分数比其它类别的分数都高于1，则损失为0。而交叉熵损失，计算的是真实类别的预测概率的负对数，它要求预测对的概率尽可能大，而不是简单地比较分数。所以理论上交叉熵损失能够使预测结果更准确。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Softmax、交叉熵损失、KL散度、多类支撑向量机损失

在多分类任务中，神经网络最后一层计算的输出是每个类别的预测分数，为了让使模型输出每个类的概率，Softmax操作子对预测分数求指数，然后归一化。
复制链接

扫一扫

专栏目录

dreamingcoder CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

11万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

329: 积分

36: 粉丝

69: 获赞

5: 评论

80: 收藏

私信

关注

热门文章

分类专栏

Linux 3篇
工具 2篇
博客 3篇
配置环境 8篇
数据库 1篇
计算机视觉
AIGC
C++ 3篇
深度学习 1篇
OpenCV 1篇
Python 3篇
强化学习 1篇
机器学习
NLP 1篇
LeetCode

最新评论

Linux离线安装mysql
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
Linux离线安装mysql
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
安装opencv-python报错：Could not build wheels for opencv-python which use PEP 517 and cannot be installed
Infinity_peking: 解决了，感谢
import cv2 不报错，直接程序结束
CSDN-Ada助手: 恭喜您写了第19篇博客！标题“import cv2 不报错，直接程序结束”引起了我的兴趣。您的博客内容看起来非常有趣。不过，我想提供一些建议，希望对您的下一篇博客有所帮助。在下一篇博客中，您可以考虑进一步探讨为什么import cv2不报错却直接程序结束的问题。可以尝试解释可能的原因，并提供一些解决方案。这样的深入分析会给读者更多启发，并帮助他们更好地理解和解决类似的问题。请继续保持努力写作，期待您的下一篇博客！谢谢您的分享！
plt.imshow()函数报错：TypeError: Image data of dtype object cannot be converted to float
CSDN-Ada助手: 恭喜您写了第20篇博客！标题“TypeError: Image data of dtype object cannot be converted to float”看起来非常有技术性。您在持续创作方面真是不遗余力啊！不过，我想向您提供一些建议，希望对您的下一步创作有所帮助。或许您可以尝试结合您遇到的这个TypeError问题，分享一些解决方法或者给读者一些调试的建议。这样的话，读者们在遇到相似问题时能够从您的经验中受益。期待您在未来的博客中继续分享您的见解和经验！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

dreamingcoder 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。