pytorch损失函数redution参数使用sum和mean，none对于训练有什么不一样的影响

最新推荐文章于 2024-09-16 19:52:18 发布

众妙zm

最新推荐文章于 2024-09-16 19:52:18 发布

阅读量225

点赞数 1

文章标签： pytorch 深度学习人工智能

本文链接：https://blog.csdn.net/m0_73792960/article/details/140874311

版权

pytorch中损失函数有一个参数reduction，它有3个选项分别是none，mean，sum，在学习过程中我产生了一个疑问，这三个参数对于训练有什么影响，在反向传播的时候难道根据batch自动求平均了吗？

经过查找了一些回答，我得到了一个还算满意的答案，接下来先看两段代码：

参数为mean

net=nn.Linear(10,10)
x=torch.randn(10,10)
y=torch.randn(10,10)

loss=nn.MSELoss(reduction='mean')
out=net(x)
l=loss(out,y)
l.backward()
print(net.weight.grad.abs().sum())

# tensor(7.2299)

结果为7.2299

参数为sum

net.zero_grad()
loss=nn.MSELoss(reduction='sum')
out=net(x)
l=loss(out,y)
l.backward()
print(net.weight.grad.abs().sum())

# tensor(722.9887)

结果为722.9887

由此看到在反向传播时并不会自动根据batch求平均，而是就这么水灵灵的求出来了，sum得出的答案正好是mean*batch。

那么为什么会这样呢？

首先reduction=“sum“可以看到最后结果是与batch size有关的，也就是说我们设置learning rate的时候与batch size的大小有很大的关系，意味着梯度下降时需要的learning rate要基于batch size来考虑。

而reduction=“mean“则没有考虑这个的必要。

至于”none“，则是给深度学习工作者更多的灵活性，以便于对于loss做更多的自定义的设计。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

众妙zm

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

PyTorch深度学习实战（4）——常用激活函数和损失函数详解

盼小辉丶的博客

06-23

2942

激活函数和损失函数是深度学习模型中重要组成部分，激活函数和损失函数的选择很大程度上决定了深度神经网络的性能和精度，需要根据具体问题的特点和数据分布等因素进行选择。在本节中，将介绍深度学习中常见的激活函数和损失函数，并说明不同函数的常见应用场景。

python如何画损失函数图_Pytorch 的损失函数Loss function使用详解

weixin_39575502的博客

12-08

5126

1.损失函数损失函数，又叫目标函数，是编译一个神经网络模型必须的两个要素之一。另一个必不可少的要素是优化器。损失函数是指用于计算标签值和预测值之间差异的函数，在机器学习过程中，有多种损失函数可供选择，典型的有距离向量，绝对值向量等。损失Loss必须是标量，因为向量无法比较大小(向量本身需要通过范数等标量来比较)。损失函数一般分为4种，平方损失函数，对数损失函数，HingeLoss 0-1 损失函数...

参与评论您还未登录，请先登录后发表或查看评论

损失函数详解

易之阴阳，量子纠缠，道之一体，缘起性空

05-09

438

选择损失函数时，需要考虑模型的类型（如回归或分类）、数据的特点（如是否含有离群点）、以及优化算法的适用性。每种损失函数都有其优势和局限性，理解它们的工作原理对于设计有效的机器学习模型至关重要。

pytorch求梯度， MSE损失函数用sum和mean的区别

h1m2q3的博客

04-26

5171

pytorch求梯度， MSE损失函数用sum和mean的区别 1. z.mean()取均值操作，梯度计算如下 import torch x = torch.ones(2, 2, requires_grad=True) print(x) # tensor([[1., 1.], # [1., 1.]], requires_grad=True) y = x + 2 print(y) # tensor([[3., 3.], # [3., 3.]], grad_fn=<.

常用的损失函数合集

caip12999203000的博客

10-13

1万+

本文章从整理了计算机视觉常用的损失函数，分别从出处、原理、优缺点和代码实现几个方面进行编写。

TensorFlow基础1：reduce_sum()函数和reduce_mean()函数

闪电小飞侠

11-15

2万+

TensorFlow之reduce_sum()函数和reduce_mean()函数

损失函数loss大总结

热门推荐

年轻即出发，

06-23

11万+

分类任务loss: 二分类交叉熵损失sigmoid_cross_entropy： TensorFlow 接口： tf.losses.sigmoid_cross_entropy( multi_class_labels, logits, weights=1.0, label_smoothing=0, scope=None, loss_c...

Pytorch十九种损失函数的使用详解

12-20

参数`reduction`可设置为'none'、'mean'或'sum'，控制损失的聚合方式，默认为'mean'，即计算平均绝对差。 2. **均方误差损失（MSELoss）**：MSELoss计算两者的平方差，通常用于回归任务。同样，`reduction`参数可以...

pytorch张量索引以及sum函数mean函数unsqueeze函数

02-20

张量学习笔记

pytorch 中，使用自定义的损失函数训练模型

qq_39893689的博客

07-04

1332

pytorch 中，使用自定义的损失函数训练模型 # 当Tensor算数操作（+， -，*， %等）中，有一个Tensor的resquire_grad=True,则该操作得到的Tensor # 能够实现反向传播，自动求导的功能。 # 所以第一种自定义loss函数的方法就是使用tensor的math operation实现loss定义。 ############################################################## #1. 继承于nn.Module，nn.Mod

解决Linux服务器上下载pytorch速度过慢的问题

weixin_53697800的博客

09-13

533

torch-1.13.1+cu116-cp311-cp311-linux_x86_64.whl 注意cp311中的311指的是python版本，也需要与自己的python匹配，比如我的是3.8，我在Linux服务器中使用如下指令, 直接从指定的 URL 下载。需要下载的是GPU版本的pytorch，版本torch=1.13.1+cu116。ps:也可以使用其他下载器（如迅雷）通过镜像网站手动下载.whl文件到本地，然后。使用这种方式会从两个网址中查找安装包，清华源不存在安装包，仍然从官方下载。

AI小项目4-用Pytorch从头实现Transformer（详细注解）

虾米记的博客

09-13

1203

阅读Transformer论文并用Pytorch从头实现了简单的Transformer模型

分布式训练：（Pytorch）

最新发布

qq_55794606的博客

09-16

691

数据加载：使用多个进程来并行加载和预处理数据，通过流水线处理减少数据加载的延迟。数据传输：利用 CUDA 流优化从固定内存到 GPU 的数据传输。数据并行性：使用数据并行和 NCCL 等通信库实现高效的梯度同步和模型参数更新，优化训练过程。这种方法结合了数据加载、数据传输和数据并行处理的优化，能够显著提升深度学习模型的训练效率和速度。dataset,num_workers=4, # 使用 4 个子进程加载数据pin_memory=True # 将数据转移到固定内存# 模型训练代码# ...

使用 PyTorch 从头开始构建您自己的 Llama 3 架构

因为无知，所以奋斗！

09-13

1279

Llama 3 及其其他变体是目前 LLM 领域最流行的开源 LLM。我相信从头开始构建 Llama 3 的能力为构建许多新的令人兴奋的基于 LLM 的应用程序提供了所有必要的基础。我坚信知识应该对所有人免费。请随意使用源代码并更新它来构建您的个人或专业项目。祝大家好运。参考/wp:list。

探索pytorch数据集中Mnist数据集的数据格式

算法与编程之美

09-13

402

1 问题1.1安装pytorch时，由于使用的vscode编译器，所以采用pip进行安装，但是遇到pytorch版本与python版本不对应的问题。1.2探索pytorch数据集中Mnist数据集的数据格式。2 方法2.1 首先查看自己电脑能够适应的pytorch版本2.2 打开pytorch的官网，选择对应的版本2．3 最后在vscode的终端运行复制的pip代码。（下载pytorch命令：pi...

pytorch使用技巧

m0_73776435的博客

09-13

958

我们将模型划分为两部分，存放到一个列表里，每部分就对应上面的一个字典，在字典里设置不同的学习率。：去除dim指定的且size为1的维度，维度大于1时，squeeze()不起作用，不指定dim时，去除所有size为1的维度。也可以在列表外设置一个全局学习率，当各部分字典里设置了局部学习率时，就使用该学习率，否则就使用列表外的全局学习率。的作用就是释放缓存分配器当前持有的且未占用的缓存显存，以便这些显存可以被其他GPU应用程序中使用，并且通过。设置当前使用的GPU设备仅为0号设备，设备名称为。

【深度学习|PyTorch】基于 PyTorch 搭建 U-Net 深度学习语义分割模型——附代码及其解释！

985小水博的摸鱼日常

09-14

573

【深度学习|PyTorch】UNet学习笔记！

《深度学习》PyTorch 手写数字识别案例解析及实现＜上＞

wx_AHao1004Y的博客

09-13

1409

MINIST是一种基于神经网络的手写数字识别算法。它是LeCun等人在1998年提出的，是深度学习领域的里程碑之一。MINIST数据集包含了大量的手写数字图片，MINIST算法通过训练神经网络，可以有效地识别这些手写数字。MINIST算法在计算机视觉和模式识别中有广泛的应用，被认为是机器学习领域的经典问题之一。MNIST包含70,000张手写数字图像，其中60,000张用于训练，10,000张用于测试。所有的图像都是灰度的，大小为28x28像素的，并且居中的，以减少预处理和加快运行。

PyTorch模型训练：损失函数与优化器详解

"PyTorch模型训练实用教程，讲解如何选择损失函数和优化器进行模型优化，包括L1Loss和MSELoss的介绍" 在机器学习和深度学习中，模型的训练过程通常涉及两个关键组件：损失函数和优化器。在PyTorch中，这两个组件的...