Pytorch里的CrossEntropyLoss详解

最新推荐文章于 2024-05-13 14:59:23 发布

Leora_lh

最新推荐文章于 2024-05-13 14:59:23 发布

阅读量4.1k

点赞数 1

分类专栏： pytorch 文章标签： pytorch 深度学习神经网络

版权

2 篇文章 0 订阅

订阅专栏

首先要知道上面提到的这些函数一部分是来自于torch.nn,而另一部分则来自于torch.nn.functional(常缩写为F）。二者函数的区别可参见知乎:torch.nn和funtional函数区别是什么？

下面是对与cross entropy有关的函数做的总结：

下面将主要介绍torch.nn.functional中的函数为主,torch.nn中对应的函数其实就是对F里的函数进行包装以便管理变量等操作。

在介绍cross_entropy之前先介绍两个基本函数：

log_softmax

这个很好理解，其实就是log和softmax合并在一起执行。

该函数的全程是negative log likelihood loss，函数表达式为

f(x,class)=−x[class]f(x,class)=−x[class]

例如假设x=[1,2,3],class=2x=[1,2,3],class=2,那额f(x,class)=−x[2]=−3f(x,class)=−x[2]=−3

交叉熵的计算公式为:

cross_entropy=−∑k=1N(pk∗logqk)cross_entropy=−∑k=1N(pk∗log⁡qk)

其中pp表示真实值，在这个公式中是one-hot形式；qq是预测值，在这里假设已经是经过softmax后的结果了。

仔细观察可以知道，因为pp的元素不是0就是1，而且又是乘法，所以很自然地我们如果知道1所对应的index，那么就不用做其他无意义的运算了。所以在pytorch代码中target不是以one-hot形式表示的，而是直接用scalar表示。所以交叉熵的公式(m表示真实类别)可变形为：

cross_entropy=−∑k=1N(pk∗logqk)=−logqmcross_entropy=−∑k=1N(pk∗log⁡qk)=−logqm

仔细看看，是不是就是等同于log_softmax和nll_loss两个步骤。

所以Pytorch中的F.cross_entropy会自动调用上面介绍的log_softmax和nll_loss来计算交叉熵,其计算方式如下:

loss(x,class)=−log(exp(x[class])∑jexp(x[j]))loss⁡(x,class)=−log⁡(exp⁡(x[class])∑jexp⁡(x[j]))

代码示例

关注