pytorch中F.cross_entropy和F.nll_loss的区别

最新推荐文章于 2025-03-29 20:33:52 发布

fpan98

最新推荐文章于 2025-03-29 20:33:52 发布

阅读量1.5w

点赞数 35

分类专栏：深度学习文章标签： python 深度学习

本文链接：https://blog.csdn.net/code_plus/article/details/115481575

版权

深度学习专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了PyTorch中CrossEntropyLoss和NLLLoss的区别，主要在于输入处理。CrossEntropyLoss会先进行log_softmax操作，然后传给NLLLoss，而NLLLoss直接接受对数概率向量。通过实验验证，使用nll_loss手动实现cross_entropy得到的结果与内置函数一致，证实了这一区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

搞懂函数的区别的最好方法就是产看函数的底层实现。

首先可以在pytorch中分别点击进入函数内部，看他们的具体实现。
1、F.cross_entropy的内部实现是：
在这里插入图片描述
并且cross_entropy函数的返回值是：
2、F.nll_loss的内部实现是：

3、结论
这里先上结论。这两种损失的区别在于input上的操作，对于cross_entropy来说，他首先会对input进行log_softmax操作，然后再将log_softmax(input)的结果送入nll_loss；而nll_loss的input就是input。
NLLLoss 的输入是一个对数(log)概率(softmax)向量和一个目标标签. 它不会为我们计算对数概率. 适合网络的最后一层是log_softmax.
损失函数 nn.CrossEntropyLoss() 与 NLLLoss() 相同, 唯一的不同是它为我们去做 log_softmax.

4、实验验证

input = torch.tensor([[[[0.5546, 0.1304, 0.9288],
                        [0.6879, 0.3553, 0.9984],
                        [0.1474, 0.6745, 0.8948]],
		               [[0.8524, 0.2278, 0.6476],
                        [0.6203, 0.6977, 0.3352],
                        [0.4946, 0.4613, 0.6882]]]])
target = torch.tensor([[[0, 0, 0],
                       [0, 0, 0],
                       [0, 0, 1]]])
# cross_entropy的实现               
loss = F.cross_entropy(input, target)
print(loss)

# 利用nll_loss实现cross_entropy
input = F.softmax(input, dim=1)
input = torch.log(input)
# input = F.log_softmax(input, dim=1)  # 上面的两行代码和这个是等价的
loss = F.nll_loss(input, target)
print(loss)