nn.CrossEntropyLoss与F.nll_loss

本文详细解析了PyTorch中nn.CrossEntropyLoss和F.nll_loss两个损失函数的区别。nn.CrossEntropyLoss内部包含了softmax操作,而F.nll_loss则需要外部自行计算概率。它们都用于多分类任务,输入要求分别为网络预测的概率输出和原始标签。正确使用这两个函数对于训练神经网络至关重要。
摘要由CSDN通过智能技术生成

F.nll_loss计算方式是下式,在函数内部不含有提前使用softmax转化的部分;
nn.CrossEntropyLoss内部先将输出使用softmax方式转化为概率的形式,后使用F.nll_loss函数计算交叉熵。

在这里插入图片描述
也就是:

CrossEntropyLoss()=log_softmax() + NLLLoss() 
  • 注意:
    两个函数的输入分别是input和target,
    input是网络预测的输出,形状为(batch_size, pro),其中pro为class的个数;
    target是标签,不需要在进行转化为one_hot的形式,其形状为(batch_size,)。

代码:

    output = torch.randn((2, 10))
    target = torch.tensor([1, 2])

    cross_loss = nn.CrossEntropyLoss()
    loss_cross = cross_loss(output, target)

    n_loss = F.nll_loss(F.log_softmax(output, dim=1), target)

    print("loss_cross:", loss_cross)
    print("nll_loss:", n_loss)

#output
	loss_cross: tensor(2.4081)
    nll_loss: tensor(2.4081)

源码:

class CrossEntropyLoss(_WeightedLoss):
	__constants__ = ['ignore_index', 'reduction']
    ignore_index: int

    def __init__(self, weight: Optional[Tensor] = None, size_average=None, ignore_index: int = -100,
                 reduce=None, reduction: str = 'mean') -> None:
      
torch.nn.CrossEntropyLoss是PyTorch中常用的交叉熵损失函数之一。它结合了torch.nn.LogSoftmax和torch.nn.NLLLoss两个函数,用于多分类问题的训练中。交叉熵损失函数常用于衡量模型输出与真实标签之间的差异。 在torch.nn.CrossEntropyLoss中,输入的形状为(batch_size, num_classes),其中batch_size是每个训练批次的样本数量,num_classes是分类的类别数量。在训练过程中,模型输出的结果会通过torch.nn.LogSoftmax函数进行处理,得到对应的概率分布。然后,模型预测的概率分布与真实标签之间会被计算交叉熵损失。 交叉熵损失函数的计算公式如下: loss = -sum(y_true * log(y_pred)) 其中,y_true是真实标签的概率分布,y_pred是模型预测的概率分布。 torch.nn.CrossEntropyLoss会自动将模型输出的概率分布进行归一化,并进行log运算。因此,在使用torch.nn.CrossEntropyLoss时,不需要手动应用torch.nn.LogSoftmax函数。 需要注意的是,torch.nn.CrossEntropyLoss函数的输入不包含softmax层。如果模型的最后一层是softmax层,可以直接使用torch.nn.CrossEntropyLoss来计算损失。如果模型的最后一层是logits层(未经过softmax激活),可以使用torch.nn.CrossEntropyLoss配合torch.nn.LogSoftmax来计算损失。 总结起来,torch.nn.CrossEntropyLoss是PyTorch中用于多分类问题训练的交叉熵损失函数,它结合了torch.nn.LogSoftmax和torch.nn.NLLLoss两个函数,并且可以适用于不同形式的模型输出。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值