NLL_LOSS与CROSS_ENTROPY_LOSS详解

bit_lin

已于 2022-11-02 01:31:50 修改

阅读量836

点赞数 2

文章标签： pytorch 深度学习 python

于 2022-09-05 02:10:43 首次发布

本文链接：https://blog.csdn.net/gxg_boss6/article/details/126696719

版权

NLL_LOSS, CROSS_ENTROPY_LOSS详解

常用损失函数

常用损失函数

nll

官方文档

torch.nn.functional.nll_loss(input, target, weight=None, size_average=None, 
ignore_index=- 100, reduce=None, reduction='mean')

$\ target,(N);\ weight,(C)$
$N, C$ 分别为批大小batch_size和类别数class_num
reduction及函数含义：选取target对应下标的结果，在batch维，求和(reduction=‘sum’)或求平均(mean)或不操作(none)作为结果。
size_average和reduce作用类似，应该不用管。
返回值形状为 $(1)$ 或 $(N) (n o n e 情况下)$ 。
ignore_index为忽略指定下标的值，不参与计算以及梯度传递。

cross_entropy

torch.nn.functional.cross_entropy(input, target, weight=None, size_average=None,
 ignore_index=- 100, reduce=None, reduction='mean', label_smoothing=0.0)

参数和返回值与NLL_LOSS基本一致。
含义：nll取下标的结果先softmax后取对数，并加负号。 $- l o g (so f t ma x (n ll (X)))$
此处softmax即exp(下标结果)与∑exp(每个结果)比值。
log即ln自然对数。
解释：softmax首先得到一个类似概率的结果，取值(0,1)，然后取对数为一个负值结果，在加上符号得到一个正的损失值。
当下标对应值结果大时，softmax结果更接近1，取log的负值越接近0，损失值也就越小（越接近0）。
同理，下标对应值小时，softmax结果接近0，取log的结果为负无穷，损失值为正无穷。

一段代码

def loss_fn(out, tar):
    out = out.view(-1, out.shape[-1])
    tar = tar.view(-1)
    return F.cross_entropy(out, tar, ignore_index=2)  # pad

transformer中的一段经典代码

此处比较结果out与tar目标值，来计算损失。
变量形状：out为 $(N, L, C)$ ，tar为 $(N, L)$ 。其中L为句子长度，需要针对每个词计算损失。
这里在使用前先将out和tar通过view转为了 $(N * L, C)$ 和 $(N * L)$ 形状，然后再来计算每个词的损失。
不转的话，按照函数定义，需要将out中的C转到第二维(中间)(N,C,L)。
ignore_index为忽略下标为2的tar结果，此处为pad填充，即transformer中mask掉的值。
最终结果为每个词的损失的平均值。

bit_lin

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫