深入理解交叉熵损失函数是怎么工作的（通俗易懂）

最新推荐文章于 2025-03-22 22:01:38 发布

叫我五哥

最新推荐文章于 2025-03-22 22:01:38 发布

阅读量823

点赞数 1

文章标签：损失函数

原文链接：https://blog.csdn.net/qq_38742161/article/details/85156539

版权

本文深入探讨了交叉熵在分类任务中的作用，解释了其作为损失函数的原理，以及如何衡量预测概率分布与真实概率分布之间的差距，对于理解神经网络模型优化目标至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_38742161/article/details/85156539

神经网络模型的优化目标是通过损失函数(loss function)来定义的。交叉熵作为分类任务中经典的损失函数，本文将介绍其原理。

分类问题损失函数

分类问题和回归问题是监督学习的两大种类。在分类问题上，通过神经网络解决分类问题常用的方法是设置n个输出节点，n为类别的个数。这时候需要判断输出指标，损失函数解决了该如何确定一个输出向量和期望的向量有多接近的问题。

熵

熵的本质是香农信息量的期望。

这里写图片描述

交叉熵

交叉熵刻画的是两个概率分布的距离，即通过概率分布q表达概率分布p的困难程度。我们通常以向量的形式表征p和q两个概率分布，那么问题就转化为向量p和q之间的距离有多近。

衡量向量见距离最常用的是一范数或二范数（方差代价函数），我们从二范数说起：

这里写图片描述

这里写图片描述

举例

这里写图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。