Cross-entropy 和 Binary cross-entropy

最新推荐文章于 2025-03-07 13:39:09 发布

子燕若水

最新推荐文章于 2025-03-07 13:39:09 发布

阅读量6.3k

点赞数 20

分类专栏：深度学习算法数学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010087338/article/details/110001810

版权

深度学习算法同时被 2 个专栏收录

159 篇文章

订阅专栏

73 篇文章

订阅专栏

本文解释了交叉熵损失的概念及其在机器学习中的应用。通过具体的例子介绍了如何计算交叉熵损失，并对比了目标概率向量和预测概率向量之间的差异。此外还讨论了二元交叉熵作为交叉熵的一个特例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Image for post

Cross-entropy 实际上是目标概率向量和预测概率向量的比较。

假设target向量[1, 0, 0] 代表狗(狗的概率是1,其它的概率全为0)

向量[0, 1, 0] 代表猫

向量[0, 0, 1] 代表熊猫

每张图片只能是上面三种中的一种, 那么 target向量就是目标概率向量。

举个例子，算loss

一张狗的图片（[1,0,0]）经过网络模型后得到一个向量[0.6, 0.3, - 0.1],再经过一次softmax变成预测的概率向量[0.5, 0.3, 0.2]

目标概率向量和预测概率向量通过下面公式进行比较

Image for post

=-(1*log(0.5) + 0*log(0.3) + 0 *log(0.2))

可以看出预测概率向量越接近目标概率向量,cross-entropy的值越小。

Binary cross-entropy 是 Cross-entropy 的一种特殊情况,

当目标的取之只能是0 或 1的时候使用。

Image for post

比如预测图片是不是熊猫,1代表是,0代表不是。

图片经过网络模型后得到一个数值15,经过sigmoid激活后变成在[0,1)范围内的一个概率值0.8。

那么target是1, 和预测值0.8如何利用 Cross-entropy来比较呢?Cross-entropy是用来比较概率向量的,

把数值转换成概率向量就可以了。

1 转换成 [1,0], 0.8转换成[0.8, 0.2],再代入 Cross-entropy的公式就可以了,

Cross-entropy = -(1 * log(0.8) + 0 * log(0.2))

OK啦!

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

子燕若水 吹个大气球

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。