pytorch loss.backword() 时间太长

最新推荐文章于 2025-04-22 10:26:09 发布

咖乐布小部

最新推荐文章于 2025-04-22 10:26:09 发布

阅读量4.1k

点赞数 4

文章标签： pytorch

本文链接：https://blog.csdn.net/weixin_42253689/article/details/128927718

版权

文章讨论了在深度学习中，数据在进入模型前未进行深拷贝会造成的性能问题。不进行深拷贝会导致在反向传播时搜索原始数据地址，增加计算时间。解决方案是使用`clone().detach()`或`deepcopy`在数据进入模型前创建副本。示例代码展示了如何在训练循环中应用此方法，结果表明性能有显著提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

直接原因是：数据在进入模型之前没有进行深拷贝

深层原因大概是：如果不进行深拷贝，在梯度反向传播过程中，要寻找原始数据的地址，这个过程非常耗时间。（直接等号是前拷贝，是将新的变量指向原来变量的地址）

解决办法：

tensor_a = tensor_b.clone().detach()

或者用deepcopy也行。

位置呢，就放到数据进入模型之前就可以。大概如下：

data = loader.get_batch('train')

data_copy = data.clone().detach()

optimizer.zero_grad()
out,loss = model(data_copy)
loss.backward()
optimizer.step()

如果data是tensor构成的字典或者list，遍历处理里面的每一项即可。

效果展示：

加之前

加之后

效果十分显著

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

咖乐布小部

关注关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

在Pytorch下，由于反向传播设置错误导致 loss不下降的原因及解决方案*

qq_19329785的博客

11-19

1万+

在Pytorch下，由于反向传播设置错误导致 loss不下降的原因及解决方案本人研究生渣渣一枚，第一次写博客，请各路大神多多包含。刚刚接触深度学习一段时间，一直在研究计算机视觉方面，现在也在尝试实现自己的idea，从中也遇见了一些问题，这次就专门写一下，自己由于在反向传播（backward）过程中参数没有设置好，而导致的loss不下降的原因。对于多个网络交替【描述】简单描述一下我的网络结构，...

关于pytorch中网络loss传播和参数更新的理解

smallwhite620451的博客

09-03

3758

转载自https://www.jb51.net/article/168009.htm 1. loss计算和反向传播 1 2 3 4 5 6 7 8 import torch.nn as nn criterion = nn.MSELoss().cuda() output = model(input) loss = criterion(output, tar...

2 条评论您还未登录，请先登录后发表或查看评论

pytorch的Backward过程用时太长？

ahhhhhh520的博客

05-19

3862

pytorch的Backward过程用时太长?问题描述解决方案问题描述使用pytorch对网络进行训练的时候遇到一个问题，forward阶段很快(只需要几毫秒)，backward阶段却用时很长(需要十多秒)。导致这个问题的原因很容易被大家忽视，而且网上基本上没有直接的解决方案，经过一天的折腾，总算把导致这个问题的原因搞清楚了。解决方案导致这个问题的原因在于训练数据的浅拷贝，由于backward过程中的梯度是和模型推理过程中的张量相关的，如果这些张量在被模型使用之前没有被深拷贝，意味着backward

10招立竿见影的PyTorch性能优化技巧，让模型训练速度翻倍

最新发布

deephub

04-22

4523

高效PyTorch应用开发的核心在于全面理解并正确应用框架提供的性能优化特性。不同优化技术在不同模型架构和应用场景下效果各异，需要根据具体项目需求进行选择和组合。将这些技术优化与良好的编码实践相结合，是构建高性能、可维护的深度学习系统的基础。正如本文所强调的，“把所有事情都做对比把所有事情都做错要好得多”。通过系统性地应用这些最佳实践，开发者能够充分发挥PyTorch框架的潜力，构建更高效、更可靠的深度学习应用。

pytorch计算图扩大，反传变慢问题debug

u013517182的博客

06-02

1756

是这样的，我自己写了一个block，这个block的内容如下 # 为了更加集成，给定两个角度，生成compact的倾斜图片 class Compact_Homo(nn.Module): def __init__(self, device): super(Compact_Homo, self).__init__() # 假设内参数K为单位矩阵 ...

Pytorch中的backward

兔清风的博客

03-30

1万+

原文：https://sherlockliao.github.io/2017/07/10/backward/接触了PyTorch这么长的时间，也玩了很多PyTorch的骚操作，都特别简单直观地实现了，但是有一个网络训练过程中的操作之前一直没有仔细去考虑过，那就是loss.backward()，看到这个大家一定都很熟悉，loss是网络的损失函数，是一个标量，你可能会说这不就是反向传播吗，有什么好讲的。

pytorch 训练过程中缓存不断增大 and loss.backword()占用缓存过大

咖乐部

02-08

1224

total_loss += loss.cpu().detach().numpy()

关于pytorch的backward()

qq_27095227的博客

08-06

1505

pytorch中的loss.backward()是梯度反传，计算每一个变量的grad。只是之前在纠结GAN的两个loss什么时候反传，参数什么时候更新的时候，观察到backward()后，内存的存储量下降，原来反传完毕之后，就把中间计算变量都释放了。所以你重复运行两次loss.backward()会报错： Trying to backward through the graph a second time, but the buffers have already been freed. 当然你可以加

lossbackward没有反应，没有任何报错，如何解决？

CHIchiCHI2012的博客

07-15

776

loss.backward（）报错

weixin_43736457的博客

01-02

2279

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [512, 1]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: enable anomaly detection

pytorch.backward()

01-06

pytorch.backward() 举例上手y=w*x，自动求导 import torch from torch.autograd import Variable x=Variable(torch.Tensor([2])) y=Variable(torch.Tensor([10])) w = Variable(torch.randn(1),requires_grad = True) print(w) loss=torch.nn.MSELoss() optimizer=torch.optim.Adam([w],lr=0.05) for i in range(1000): optimiz

训练五步走：前向传播、计算损失、清零梯度optimizer.zero_grad()、反向传播loss.backward()、更新参数optimizer.step()

qq_43629945的博客

06-29

2081

outputs = model(inputs)前向传播，model为实例化后的模型； loss = criterion(outputs, targets)计算损失，criterion为定义的损失函数； Pytorch自动求导机制会将梯度值累加，故要optimizer.zero_grad()清零，去掉以前的梯度值； loss.backward()反向传播，通过自动微分计算损失函数相对于模型参数的梯度； optimizer.step()根据计算出的梯度更新模型的参数。

loss.sum().backward()中对于sum()的理解

跟着大数据和AI去旅行

04-30

775

PyTorch backward() 进行梯度计算时，只能对标量进行梯度计算。.sum() 函数主要有两个作用，一个是用来求和，一个是用来降维。在深度学习中，损失函数都是标量，所以一般情况下可以直接调用backward()就可以了。

关于pytorch损失函数的梯度计算

weixin_40286308的博客

09-13

1795

今天想实现一个idea：对同一批数据，采用两次计算。第一次就用正常的交叉熵，第二次针对第一次的情况，对gt作出改变，再做一遍交叉熵。要想写同一批数据训练两次，还要引入控制变量，来控制哪一次是正常计算，哪一次是改变计算，太麻烦了。于是想到，我直接在算loss的时候，就算两遍，把两遍加起来，是不是就是等效的？最终去复习了pytorch的梯度机制，确定是差不多的。当然训练两次的话，第一次正常的结束后，模型就已经优化了，第二次改变的训练，用的是优化后的模型；而在loss里计算两次，用的都是优化前的模型。

Pytorch的反向传播backward()详解

知识搬运者

04-05

2895

我们的回传某个网络的loss时，是不能有其他网络输出的可求导数据的，也就是我们在将其他网络的输出传入需要回传的网络进行结果的损失计算时，需要将其他网络的输出加上detach()才不会报错。这时候，我们就需要用上分步回传了，结果是不变的。，当我们的对相同的loss回传多次，只有最后一次不加retain_graph参数外，其余都得加，否则报错。在Pytorch中，我们有时候会进行多个loss的回传，然而回传中，会发生一些错误。3、当然，以上回传我们还可以加在一起，一并回传，那么梯度也会叠加，同上面的结果等价。

loss.backward() Segmentation fault 段错误

pprp的博客

11-20

1890

在运行一个非常简单的深度学习程序的时候，发现运行一段时间会报错段错误经过定位发现是执行loss.backward()的时候出现的问题，而源码明显是没有什么问题的。具体排查可以这样： gdb --args python train.py 然后发现这个问题是存在pytorch内部的，而不是自己写的逻辑有问题。注：这个torch版本是1.8.0, 执行其他程序没有明显报错。更新到1.10.0版本就可以解决segmentation fault的问题。 ...

关于loss.backward()以及其参数retain_graph的一些坑