Pytorch nn.BCEWithLogitsLoss()的简单理解与用法

最新推荐文章于 2025-04-10 11:12:46 发布

xiongxyowo

最新推荐文章于 2025-04-10 11:12:46 发布

阅读量3.9w

点赞数 51

分类专栏： Pytorch 文章标签：划水

本文链接：https://blog.csdn.net/qq_40714949/article/details/120295651

版权

Pytorch 专栏收录该内容

26 篇文章

订阅专栏

这个东西，本质上和nn.BCELoss()没有区别，只是在BCELoss上加了个logits函数(也就是sigmoid函数)，例子如下：

import torch
import torch.nn as nn

label = torch.Tensor([1, 1, 0])
pred = torch.Tensor([3, 2, 1])
pred_sig = torch.sigmoid(pred)
loss = nn.BCELoss()
print(loss(pred_sig, label))

loss = nn.BCEWithLogitsLoss()
print(loss(pred, label))

loss = nn.BCEWithLogitsLoss()
print(loss(pred_sig, label))

输出结果分别为：

tensor(0.4963)
tensor(0.4963)
tensor(0.5990)

可以看到，nn.BCEWithLogitsLoss()相当于是在nn.BCELoss()中预测结果pred的基础上先做了个sigmoid，然后继续正常算loss。所以这就涉及到一个比较奇葩的bug，如果网络本身在输出结果的时候已经用sigmoid去处理了，算loss的时候用nn.BCEWithLogitsLoss()…那么就会相当于预测结果算了两次sigmoid，可能会出现各种奇奇怪怪的问题——

比如网络收敛不了（流泪猫猫头.jpg）