分类问题一般用交叉熵损失，回归问题用平方差损失

小石头..

已于 2023-07-29 10:56:26 修改

阅读量63

点赞数

文章标签：分类回归 python 深度学习

于 2023-07-26 20:28:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31049349/article/details/131947084

版权

用一个带数据的例子来演示交叉熵损失函数的计算过程。（手写数字识别）

假设我们有一个样本，其真实标签是数字"2"。对应的真实标签的one-hot向量是 [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]，因为"2"的索引位置是2，所以在one-hot向量中第3个位置是1，其他位置都是0。

假设LeNet模型对于这个样本的输出为一个形状为 (10,) 的预测概率向量，例如 [0.01, 0.03, 0.8, 0.04, 0.02, 0.01, 0.06, 0.01, 0.02, 0.0].

我们将使用这些数据来计算交叉熵损失值。

首先，我们对预测概率的对数进行计算：
在这里插入图片描述
然后，我们根据真实标签的one-hot向量来确定正确的类别，即

的类别。在这个例子中，真实标签对应的位置是第3个位置（数字"2"对应的位置）。

接下来，我们将预测概率的对数与真实标签的one-hot向量进行元素级别的乘法运算：在这里插入图片描述
然后，对这些乘积结果进行求和得到损失值：

所以，对于这个样本，交叉熵损失值为 -log(0.8)。在训练过程中，优化算法会通过最小化这个损失值来调整模型的参数，使得模型的预测结果更加准确和可信。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分类问题一般用交叉熵损失，回归问题用平方差损失

对应的真实标签的one-hot向量是 [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]，因为"2"的索引位置是2，所以在one-hot向量中第3个位置是1，其他位置都是0。假设LeNet模型对于这个样本的输出为一个形状为 (10,) 的预测概率向量，例如 [0.01, 0.03, 0.8, 0.04, 0.02, 0.01, 0.06, 0.01, 0.02, 0.0].在这个例子中，真实标签对应的位置是第3个位置（数字"2"对应的位置）。用一个带数据的例子来演示交叉熵损失函数的计算过程。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。