Cross Entropy Loss 交叉熵损失详解

jjw_zyfx

已于 2022-03-03 21:41:19 修改

阅读量608

点赞数

于 2022-03-03 16:45:47 首次发布

本文链接：https://blog.csdn.net/jjw_zyfx/article/details/123257624

版权

python 同时被 3 个专栏收录

125 篇文章 2 订阅

订阅专栏

pytorch

69 篇文章 8 订阅

订阅专栏

学术论文

8 篇文章 1 订阅

订阅专栏

交叉熵公式：

$\sum plogq$

为啥使用交叉熵，先看一组例子对比

如果对于多分类的真实值的概率为q = [1, 0, 0, 0, 0] 可以理解为，[是猫,非猫,非猫,非猫,非猫]
多分类的预测值的概率为(第一组)p = [0.4, 0.3, 0.05, 0.05, 0.2] 则计算交叉熵结果为：0.916
如果预测值的结果为另一组(第二组)即p=[0.98, 0.01, 0, 0, 0.01]则交叉熵的结果为：0.02
经过对比发现第一组的交叉熵的结果比第二组的大不少，如果作为损失，我们当然首选第二组，因为损失越小，越说明我们的预测结果和真实结果越接近在代码中使用：

x = torch.randn(1, 784)
w = torch.randn(10, 784)
x_w = x@w.T  # 向量计算
print(x_w.shape)  # torch.Size([1, 10])
pred = F.softmax(x_w, dim=1)  # 按行计算softmax
print(pred.shape)  # torch.Size([1, 10])
pred_log = torch.log(pred)
result = F.nll_loss(pred_log, torch.tensor([3]))
print(result)  # tensor(7.0880) 因为随机所以每次结果会不一样但是result和cross_result的结果一样
# 下边这个cross_entropy等价于上边的三个操作的集合即
# cross_entropy == softmax+log+nll_loss
cross_result = F.cross_entropy(x_w, torch.tensor([3]))
print(cross_result)  # tensor(7.0880) 因为随机所以每次结果会不一样但是result和cross_result的结果一样

jjw_zyfx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Cross Entropy Loss 交叉熵损失详解

交叉熵公式：H(p,q)=−∑plogqH(p,q) = - \sum plogqH(p,q)=−∑plogq为啥使用交叉熵，先看一组例子对比如果对于多分类的真实值的概率为q = [1, 0, 0, 0, 0] 可以理解为，[是猫,非猫,非猫,非猫,非猫]多分类的预测值的概率为(第一组)p = [0.4, 0.3, 0.05, 0.05, 0.2] 则计算交叉熵结果为：0.916如果预测值的结果为另一组(第二组)即p=[0.98, 0.01, 0, 0, 0.01]则交叉熵的结果为：0.02经过
复制链接

扫一扫