Pytorch GPU内存占用很高,但是利用率很低

1.GPU 占用率,利用率

输入nvidia-smi来观察显卡的GPU内存占用率(Memory-Usage),显卡的GPU利用率(GPU-util)

GPU内存占用率(Memory-Usage) 往往是由于模型的大小以及batch size的大小,来影响这个指标
显卡的GPU利用率(GPU-util) 往往跟代码有关,有更多的io运算,cpu运算就会导致利用率变低。比如打印loss, 输出图像,等等

在这里插入图片描述

这个时候发现,有一块卡的利用率经常跳到1%,而其他三块卡经常维持在70%以上

2.原因分析

当没有设置好CPU的线程数时,Volatile GPU-Util参数是在反复的跳动的,0%,20%,70%,95%,0%。这样停息1-2 秒然后又重复起来。其实是GPU在等待数据从CPU传输过来,当从总线传输到GPU之后,GPU逐渐起计算来,利用率会突然升高,但是GPU的算力很强大,0.5秒就基本能处理完数据,所以利用率接下来又会降下去,等待下一个batch的传入。因此,这个GPU利用率瓶颈在内存带宽和内存介质上以及CPU的性能上面。最好当然就是换更好的四代或者更强大的内存条,配合更好的CPU。

3.解决方法:

(1)为了提高利用率,首先要将num_workers(线程数)设置得体,4,8,16是几个常选的几个参数。本人测试过,将num_workers设置的非常大,例如,24,32,等,其效率反而降低,因为模型需要将数据平均分配到几个子线程去进行预处理,分发等数据操作,设高了反而影响效率。当然,线程数设置为1,是单个CPU来进行数据的预处理和传输给GPU,效率也会低。其次,当你的服务器或者电脑的内存较大,性能较好的时候,建议打开pin_memory打开,就省掉了将数据从CPU传入到缓存RAM里面,再给传输到GPU上;为True时是直接映射到GPU的相关内存块上,省掉了一点数据传输时间。

(2) 另外的一个方法是,在PyTorch这个框架里面,数据加载Dataloader上做更改和优化,包括num_workers(线程数),pin_memory,会提升速度。解决好数据传输的带宽瓶颈和GPU的运算效率低的问题。在TensorFlow下面,也有这个加载数据的设置。

(3) 修改代码(我遇到的问题)

每个iteration 都写文件了,这个就会导致cpu 一直运算,GPU 等待

在这里插入图片描述
https://blog.csdn.net/qq_32998593/article/details/92849585


如果在学习中,遇到一些代码上的问题,可以有偿咨询我!(直接CSDN私信即可)。
代辅导,代指导,算法创新点定制,bug解决,代码跑通等等
方向不限:数据分析,机器学习,深度学习,目标检测,图像分割,图像分类,图像生成等。


  • 12
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 18
    评论
PyTorchGPU利用率可能有几个原因。首先,GPU利用率可能是因为数据从CPU传输到GPU的过程中存在延迟。这可能是由于CPU线程数设置不当导致的,当线程数设置过或过时,都会影响GPU利用率。通常,4、8、16是常见的线程数选择。将线程数设置得合理可以提GPU利用率\[2\]。 其次,内存带宽和内存介质以及CPU的性能也会对GPU利用率产生影响。如果内存带宽和内存介质较差,或者CPU性能不足,都会限制数据从CPU传输到GPU的速度,从而导致GPU利用率下。在这种情况下,可以考虑升级内存条或更换更强大的CPU来提GPU利用率\[2\]。 另外,可以通过打开pin_memory选项来提GPU利用率。当服务器或电脑的内存较大且性能较好时,打开pin_memory选项可以直接将数据映射到GPU相关内存块上,省去了数据传输的时间,从而提GPU利用率\[3\]。 综上所述,要提PyTorchGPU利用率,可以适当设置线程数,升级内存和CPU,并打开pin_memory选项\[2\]\[3\]。 #### 引用[.reference_title] - *1* *2* *3* [深度学习PyTorch、TensorFlow中GPU利用率内存占用率的问题](https://blog.csdn.net/JustPeanut/article/details/119145151)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值