【pytorch损失函数之nn.CrossEntropyLoss（）、nn.NLLLoss（）】

最新推荐文章于 2024-06-22 22:41:08 发布

【网络星空】

最新推荐文章于 2024-06-22 22:41:08 发布

阅读量1.5k

点赞数

分类专栏：损失函数 pytorch 文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/weixin_42483745/article/details/124557813

版权

pytorch 同时被 2 个专栏收录

31 篇文章 4 订阅

订阅专栏

损失函数

1 篇文章 0 订阅

订阅专栏

文章目录

一、前言
二、理论
三、项目

一、前言

nn.CrossEntropyLoss()这个损失函数⽤于多分类问题虽然说的是交叉熵。

nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使⽤它来替换⽹络中的这两个操作。

二、理论

⾸先输⼊是size是(minibatch,C)。这⾥的C是类别数。损失函数的计算如下：

在这里插入图片描述

损失函数中也有权重weight参数设置 若设置权重，则公式为：

在这里插入图片描述

其他参数不具体说，和设置差不多，默认情况下，对minibatch的loss求均值。
注意这⾥的标签值class，并不参与直接计算，⽽是作为⼀个索引,索引对象为实际类别

举个栗⼦，我们⼀共有三种类别，批量⼤⼩为1（为了好计算），那么输⼊size为（1,3），具体值为torch.Tensor([[-0.7715, -0.6205,-0.2562]])。标签值为target = torch.tensor([0])，这⾥标签值为0，表⽰属于第0类。

loss计算如下：

import torch
import torch.nn as nn
import math
entroy=nn.CrossEntropyLoss()
input=torch.Tensor([[-0.7715, -0.6205,-0.2562]])
target = torch.tensor([0])
output = entroy(input, target)
print(output)
#根据公式计算

输出：
tensor(1.3447)
动⼿⾃⼰算：

我们在看看是否等价nn.logSoftmax()和nn.NLLLoss()的整合：

m = nn.LogSoftmax()
loss = nn.NLLLoss()
input=m(input)
output = loss(input, target)
print('output:',output)

输出：
input: tensor([[-1.3447, -1.1937, -0.8294]])
output: tensor(1.3447)
可以看出nn.LogSoftmax()的对输⼊的操作就是：

在这里插入图片描述

x是输⼊向量。
⽽nn.NLLLoss()的操作是：

在这里插入图片描述

这⾥没有设置权重，也就是权重默认为1，x_{n,y_n}表⽰⽬标类所对应输⼊x中值，则loss就为
在这里插入图片描述

三、项目

# coding: utf-8

import torch
import torch.nn as nn
import numpy as np
import math

# ----------------------------------- CrossEntropy loss: base

loss_f = nn.CrossEntropyLoss(weight=None, size_average=True, reduce=False)
# 生成网络输出 以及 目标输出
output = torch.ones(2, 3, requires_grad=True) * 0.5      # 假设一个三分类任务，batchsize=2，假设每个神经元输出都为0.5
target = torch.from_numpy(np.array([0, 1])).type(torch.LongTensor)

loss = loss_f(output, target)

print('--------------------------------------------------- CrossEntropy loss: base')
print('loss: ', loss)
print('由于reduce=False，所以可以看到每一个样本的loss，输出为[1.0986, 1.0986]')


# 熟悉计算公式，手动计算第一个样本
output = output[0].detach().numpy()
output_1 = output[0]              # 第一个样本的输出值
target_1 = target[0].numpy()

# 第一项
x_class = output[target_1]
# 第二项
exp = math.e
sigma_exp_x = pow(exp, output[0]) + pow(exp, output[1]) + pow(exp, output[2])
log_sigma_exp_x = math.log(sigma_exp_x)
# 两项相加
loss_1 = -x_class + log_sigma_exp_x
print('---------------------------------------------------  手动计算')
print('第一个样本的loss：', loss_1)


# ----------------------------------- CrossEntropy loss: weight

weight = torch.from_numpy(np.array([0.6, 0.2, 0.2])).float()
loss_f = nn.CrossEntropyLoss(weight=weight, size_average=True, reduce=False)
output = torch.ones(2, 3, requires_grad=True) * 0.5  # 假设一个三分类任务，batchsize为2个，假设每个神经元输出都为0.5
target = torch.from_numpy(np.array([0, 1])).type(torch.LongTensor)
loss = loss_f(output, target)
print('\n\n--------------------------------------------------- CrossEntropy loss: weight')
print('loss: ', loss)  #
print('原始loss值为1.0986, 第一个样本是第0类，weight=0.6,所以输出为1.0986*0.6 =', 1.0986*0.6)

# ----------------------------------- CrossEntropy loss: ignore_index

loss_f_1 = nn.CrossEntropyLoss(weight=None, size_average=False, reduce=False, ignore_index=1)
loss_f_2 = nn.CrossEntropyLoss(weight=None, size_average=False, reduce=False, ignore_index=2)

output = torch.ones(3, 3, requires_grad=True) * 0.5  # 假设一个三分类任务，batchsize为2个，假设每个神经元输出都为0.5
target = torch.from_numpy(np.array([0, 1, 2])).type(torch.LongTensor)

loss_1 = loss_f_1(output, target)
loss_2 = loss_f_2(output, target)

print('\n\n--------------------------------------------------- CrossEntropy loss: ignore_index')
print('ignore_index = 1: ', loss_1)     # 类别为1的样本的loss为0
print('ignore_index = 2: ', loss_2)     # 类别为2的样本的loss为0

【网络星空】

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
【pytorch损失函数之nn.CrossEntropyLoss（）、nn.NLLLoss（）】

文章目录一、前言二、理论三、项目一、前言nn.CrossEntropyLoss()这个损失函数⽤于多分类问题虽然说的是交叉熵。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使⽤它来替换⽹络中的这两个操作。二、理论⾸先输⼊是size是(minibatch,C)。这⾥的C是类别数。损失函数的计算如下：损失函数中也有权重weight参数设置若设置权重，则公式为：其他参数不具体说，和设置差不多，默认情况下，对minibat
复制链接

扫一扫