Pytorch使用中遇到的问题及解决办法（更新中）

最新推荐文章于 2022-11-03 20:53:21 发布

dreamandgo

最新推荐文章于 2022-11-03 20:53:21 发布

阅读量1.2k

点赞数

分类专栏： Pytorch 文章标签： cuda 深度学习

本文链接：https://blog.csdn.net/weixin_40051325/article/details/107973014

版权

Pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一. 前言

Pytorch学习小白，跑大佬们的源代码时难免遇到“意想不到”的问题，有过心酸崩溃路，但感恩各位大佬文章的启发帮助，一路摸爬滚打，有了起色。现整理自己学习过程中遇到的问题，方便你我他参考~

二. 问题 + 办法/解决思路

问题1. pytorch训练时gpu显存突增，崩溃，报错“out of memory”

解决思路： 对占用gpu显存的变量“后续若不再用，则用完即删”。
借鉴文章：【问题探究】如何解决pytorch训练时的显存占用递增（导致out of memory）
备注：占用gpu显存的变量的特点–“xxx.cuda()”

“用完即删”用到的“两把斧头”：
（1）del 变量名
（2）torch.cuda.empty_cache()

举例：

img = img.cuda()
segm = segm.cuda()
outputs = model(img)
# 变量img，segm和outputs均为占用gpu显存的变量
........  # 有关img，segm，outputs的代码
del img, segm, outputs
torch.cuda.empty_cache()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dreamandgo

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

安装anaconda配置pytorch虚拟环境遇到的问题及解决办法

风吹落叶的博客

11-07

3005

安装anaconda配置pytorch虚拟环境遇到的问题及解决办法 PackagesNotFoundError: The following packages are not available from current channels: python-3.8 Current channels: https://repo.anaconda.com/pkgs/main/win-64 https://repo.anaconda.com/pkgs/main/noarch https://repo.anacond

pytorch安装问题 | 在安装pytorch过程中，遇到换源还是不行的解决办法。

weixin_53592372的博客

05-16

2594

PackagesNotFoundError: The following packages are not available from current channels: CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r/win-64/repodata.json>

参与评论您还未登录，请先登录后发表或查看评论

PSENet.pytorch使用中遇到的问题以及解决，优化

街道口扛把子的博客

10-04

1672

源码总体写的还是非常棒的，反正我是不能完全地写出来。学习一下。开源地址： https://github.com/WenmuZhou/PSENet.pytorch 在这几天使用的过程中，发现了一些bug并进行了修改，对一些细节进行了优化，在这里记录下来。issue地址：https://github.com/WenmuZhou/PSENet.pytorch/issues/39 eval失败。解决：s...

行人检测arm代码调试出现的问题记录

诗雨影的博客

06-14

498

平台：嵌视科技arm板 /opt/gcc/gcc-4.6.2-glibc-2.13-linaro-multilib-2011.12/tq-linaro-toolchain/bin/../lib/gcc/arm-fsl-linux-gnueabi/4.6.2/../../../../arm-fsl-linux-gnueabi/include/c++/4.6.2/bits/c++0x_warni...

Pytorch中的bug调试记录（持续跟新）

halchan的博客

11-04

305

discriminator loss始终是一个常数，没有随着迭代次数的增加而更新将disciminator loss中的各个分量打印出来，查看原因。最后发现是因为netD输出的是经过sigmoid激活后的值，而在使用criterion是却采用了BCEWithLogitsLoss ...

python 中del 的用法

贱小杜的博客

08-09

1014

python中的del用法比较特殊，新手学习往往产生误解，弄清del的用法，可以帮助深入理解python的内存方面的问题。 python的del不同于C的free和C++的delete。由于python都是引用，而python有GC机制，所以，del语句作用在变量上，而不是数据对象上。 if __name__=='__main__': a=1 # 对象 1 被变量a引用，对象1的引用计数器为1 b=a # 对象1 被变量b引用，对象1的引用计数器加1 c=

python中的del用法

m0_37347812的博客

12-12

3049

python中的del用法

mac系统安装pytorch遇到所有问题及解决办法

01-07

#mac系统安装pytorch遇到所有问题及解决办法 由于在网上找了很多资料，有的可以解决问题，有的解决不了，所以写一篇整理文章希望对跟我同样遇到这样问题的童鞋有帮助第一步：安装anaconda，由于我之前有过就不赘述...

解决安装pytorch网络超时的一种办法

01-20

之前捣鼓安装python+tensorflow/pytorch，遇到各种问题，在这里总结记录一下。首先遇到的第一个问题是网络问题：不论是在utunbu上使用apt、使用pip，都会遇到默认源下载过慢、超时而无法安装的问题好在这个问题...

pytorch Relu

zyxzyx_的博客

10-07

704

pytorch非线性变换

python的内存管理机制是什么、怎么处理内存溢出_python之记录一次内存溢出

weixin_28880179的博客

02-10

210

问题现象手头一个系统上线后，节点机中agent应用在运行10天后，占用系统内存居然高达10GB以上，这显然是发生了严重内存泄露。问题原因python是动态语言，对用动态语言的内存分析不是很容易，尝试了一下比较经典的内存分析工具meliae，但是发现不是很好用。查了很多资料后，发现了 https://github.com/pympler/pympler这个工具，官方文档地址为：具体的分析过程我...

【Pytorch踩坑记录】深度学习程序在训练第x个Epoch的过程中直接被退出终端

Iron_lyk Blog

11-03

3401

我在一个大的数据集上训练模型时，终端或vscode界面老是在程序在跑第3个epoch的过程中自动被卡退，注意不是程序报错，而是直接将vscode退出，连错误都不报这就是头疼之处，并不知道问题出现在哪里

使用pytorch时遇到的问题汇总(一)

赵凯月的博客

04-18

2万+

1、报错TypeError: unhashable type: ‘numpy.ndarray’ 原因：在将pytorch的longTensor转为numpy，并用于dict的key的时候，会出现这样的错误。其实程序输出已经是int了，但是还是会被认为是ndarray。解决：在原来的基础上加上.item() classId = support_y[i].long().cpu().detach()....

pytorch使用过程中的错误处理之内存溢出

greatwind的博客

07-13

3124

RuntimeError: CUDA out of memory. Tried to allocate 12.74 GiB (GPU 0; 14.76 GiB total capacity; 1.19 GiB already allocated; 11.42 GiB free; 2.52 GiB reserved in total by PyTorch)

pytorch 减小显存消耗，优化显存使用，避免out of memory

热门推荐

小小码农的博客

06-14

10万+

本文是整理了大神的两篇博客：如何计算模型以及中间变量的显存占用大小：https://oldpan.me/archives/how-to-calculate-gpu-memory如何在Pytorch中精细化利用显存：https://oldpan.me/archives/how-to-use-memory-pytorch还有知乎中大神的解答：https://zhuanlan.zhihu.com/p/3...

Pytorch变量类型转换

zchenack个人专栏

01-24

9万+

Pytorch的数据类型为各式各样的Tensor,Tensor可以理解为高维矩阵。与Numpy中的Array类似。Pytorch中的tensor又包括CPU上的数据类型和GPU上的数据类型，一般GPU上的Tensor是CPU上的Tensor加cuda()函数得到。通过使用Type函数可以查看变量类型。一般系统默认是torch.FloatTensor类型。例如data = torch.Tensor(

pytorch入门之变量

cc的专栏

01-06

5172

Tensor Tenosr是一种和numpy的ndarrays是相同的概念，不同的时tensor可以用GPU来加速 #import sys #sys.executable #print(sys.path) from __future__ import print_function import torch x = torch.Tensor(5, 3) print(x

python删除变量_python中如何使用del删除变量？

weixin_39519769的博客

02-10

3904

我们对于python中不再使用的数据，会进行删除的操作。不过有些人会发现，自己删除一些数据时，另一些数据也会受到影响。在这里我们介绍一种del方法给大家，在删除上只针对变量起作用。下面我们就python中del的概念、使用注意进行介绍，然后带来实例删除的代码。1、概念del语句在删除变量时，是解除变量对数据的引用，而不是直接删除数据，不是把内存地址删了，只是删除了引用，数据就变为了一个可回收的对象...

pytorch学习笔记

weixin_42102248的博客

09-04

766

抽时间学pytorch,记录一下重点。官网60分钟教程：一、what is pytorch? 1.根据现有张量创建张量： 1）x = x.new_ones(5, 3, dtype=torch.double) x必须是之前定义过；传入的是size；dtype不定义就默认之前的；张量的数据由函数名决定。 2）a = torch.randn_like(x, dtype=torch.float) 为了...

pytorch安装中如何解决 print(torch.cuda.is_available()) #查看cuda是否可用输出为True 或者False False