pytorch中正确使用损失函数nn.MSELoss

最新推荐文章于 2025-05-09 20:11:06 发布

GeneralJing

最新推荐文章于 2025-05-09 20:11:06 发布

阅读量9.7k

点赞数 8

CC 4.0 BY-SA版权

分类专栏： pytorch

本文链接：https://blog.csdn.net/GeneralJing/article/details/112238984

pytorch 专栏收录该内容

28 篇文章

订阅专栏

本文详细介绍了PyTorch中MSELoss损失函数的reduce和size_average两个关键参数的作用及使用方法。通过实例演示了不同参数组合下，损失值的返回形式，包括向量形式的loss和标量形式的loss，并解释了size_average参数如何影响最终的loss计算结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

函数参数有reduce和size_average，类型为布尔类型。因为损失函数一般都是计算一个batch的数据，所以返回的结果都是维度为(batchsize, )的向量。

1.如果reduce=false，size_average参数失效，直接返回向量形式的loss。

2.如果reduce=true，那么loss返回的是标量

size_average=true，返回的是loss.mean()

size_average=false，返回的是loss.sum()

注意：默认情况下， reduce = True，size_average = True

import torch
import numpy as np

# 返回向量
mse_loss = torch.nn.MSELoss(reduce=False, size_average=False)

v1 = np.array([[1, 2], [3, 4]])
v2 = np.array([[2, 3], [4, 5]])

input1 = torch.autograd.Variable(torch.from_numpy(v1))
target1 = torch.autograd.Variable(torch.from_numpy(v2))

loss = mse_loss(input1.float(), target1.float())
print(loss)

# 返回平均值
v3 = np.array([[1, 2], [3, 4]])
v4 = np.array([[2, 3], [4, 4]])

mse_loss = torch.nn.MSELoss(reduce=True, size_average=False)

input2 = torch.autograd.Variable(torch.from_numpy(v3))
target2 = torch.autograd.Variable(torch.from_numpy(v4))

loss = mse_loss(input2.float(), target2.float())
print(loss)

tensor([[1., 1.],
        [1., 1.]])

tensor(3.)