GPU显存占用率过低的解决方案

最新推荐文章于 2025-03-28 23:01:11 发布

myccver

最新推荐文章于 2025-03-28 23:01:11 发布

阅读量6.9k

点赞数

文章标签： pytorch

本文链接：https://blog.csdn.net/qq_45270993/article/details/129728134

版权

训练深度学习模型时，如果GPU利用率低可能是由于Dataloader的num_workers设置不当。当num_workers设为0时，数据读取可能成为瓶颈。通常建议根据机器的CPU资源设置合理数值，如8或16，但不应超过总CPU物理核心数。此外，为防止PytorchDataLoader的内存泄漏问题，可以使用torch.multiprocessing.set_sharing_strategy(file_system)来设置共享策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在训练模型时，有时会出现GPU利用率很低的情况。有可能是CPU读取数据的速度跟不上模型训练的速度，导致GPU处于等待的状态。一个可能的原因是dataloader的num_workers=0,只有一个主进程。为避免这种情况可以根据机器设置合适的num_workers，一般设置为8或16。
注意num_workers<总CPU物理核心数

# 总核数 = 物理CPU个数 X 每颗物理CPU的核数 

# 查看物理CPU个数
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

# 查看每个物理CPU中core的个数(即核数)
cat /proc/cpuinfo| grep "cpu cores"| uniq

为避免出现Pytorch DataLoader 内存泄漏 RuntimeError: received 0 items of ancdata
添加以下代码：

torch.multiprocessing.set_sharing_strategy('file_system')

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

myccver

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Wallpaper Engine 占用GPU过高解决办法

韦_恩的博客

04-11

3万+

看到本文的时候，首先你要有一个大致认识： Wallpaper中的壁纸大致分为两种：一种是实时计算渲染的，一种是视频播放渲染的。当你明白这一点的时候就不难解释为什么有的壁纸不大，但是却给人一种挖矿的感觉，有的壁纸很大却完美运行。。。。目录吐槽：解决办法：总结吐槽：今天找到了一个很好看（屌丝）的壁纸，结果应用起来，却发现电脑卡顿严重（见下图），虽说我的显卡1650不是很好，可也不至于带不动个20多MB的壁纸吧？？？于是乎........我发现是我想简单了，他这个壁纸是..

TensorFlow 显存占用率高 GPU利用率低

ProLayman的博客

07-18

1万+

nvidia-smi指令命令位置：所以Path中添加环境变量： C:\Program Files\NVIDIA Corporation\NVSMI 试验一哈：要注意的点： Driver Version和CUDA Version不是一回事 CUDA Version实际是环境变量中Path配置的，如果一台机器同时装了多个CUDA，那么这里的CUDA Version显示的是Path中靠前的C...

参与评论您还未登录，请先登录后发表或查看评论

选择当前系统显存占用率较低的显卡

05-25

语言:C++;功能:在当前系统下选择显存使用率较低的显卡;使用环境:英伟达显卡,安装英伟达显卡驱动,(可选)配置cuda,系统:ubuntu,windows需做适当调整

GPU利用率低的解决办法

Data _designer

06-25

2万+

watch -n 0.1 -d nvidia-smi # 检查GPU利用率参数解决办法： 1. dataloader设置参数 2.增大batchsize 3. 减少IO操作，比如tensorboard的写入和打印。 4. 换显卡

实践教程｜GPU利用率低常见原因分析及优化

热门推荐

skyroach

01-07

26万+

一年前为了玩吃鸡游戏，自己组装了一台电脑，i7-8700的cpu，16G内存，240固态硬盘，GTX1070ti显卡，也还算是可以的配置，显示器和硬盘是本来就有的，就没有换新的。主要是自己一直想组装一台电脑，苦于多种原因一直没有机会，终于把自己的电脑组装好了，当时还开心的很长一段时间。组装好了后，直接就下载了吃鸡，进入游戏后，总是感觉有卡顿，查看fps只有40左右，最高的时候也不过才60，遇...

解决Tensorflow占用GPU显存问题

12-20

尤其是在将PyTorch模型转换为TensorFlow模型后，可能会发现TensorFlow会默认占用所有可用的GPU显存，即使模型本身并未完全利用这些资源。这种现象可能会阻碍多任务并行处理或者在有限的GPU资源下进行其他计算，严重...

Windows下Pytorch训练gpu占用率过低的问题

weixin_62586778的博客

03-17

950

查了很多，基本围绕num_workers, pin_memory。其中pin_memory设置了true，num_workers到2就broken pipe，只能设置0。今天用自己电脑跑训练，发现以下问题，cpu冒大烟，gpu抽大烟，动都不带动一下。准备用公司服务器跑了，自己电脑果然只能测通和不通。linux系统中可以使用。加载数据，windows系统里。

GPU 利用率低常见原因分析及优化

数据派THU

07-06

1691

来源：腾讯技术工程深度学习爱好者本文约2200字，建议阅读5分钟本文分享一些关于减少GPU资源浪费问题的解放方案。最近经常有同学反馈 GPU 利用率低，严重浪费 GPU 资源的问题，经过对一些实例分析后，借着这篇文档和大家分享一下解决方案，希望能对使用 GPU 的同学有些帮助。一、GPU 利用率的定义本文的 GPU 利用率主要指 GPU 在时间片上的利用率，即通过 nvidia-smi 显示...

GPU利用率偏低怎么办？神经网络训练速度太慢怎么办？

weixin_41602070的博客

03-02

2301

在我们深度学习算法训练中最长出现的就是 GPU利用率偏低，甚至经常出现 nvidia-smi一打开，GPU利用率为0%，隔很久才跳动一次，这究竟是为什么呢？笔者为你一一揭晓答案！做到这些，能够解决我们训练中 99%的训练速度慢问题，和 GPU利用率偏低问题。喜欢文章，关注公众号：人工智能私房菜。

GPU利用率低的原因

Do not mess it up

10-10

3万+

1. CPU数据读取更不上：读到内存+多线程+二进制文件（比如tf record） 2. GPU温度过高，使用功率太大：每次少用几个GPU，降低功耗（但是多卡的作用何在？）...

深度学习时GPU显存利用率高但是GPU利用率低的解决办法

HappierRaining

11-25

1万+

代码中添加: import os os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] = "0" //这里是自己的GPU编号，我是"0",原文是"8".

选择当前显存占用率较低的英伟达显卡

San_Junipero的博客

05-25

1351

众寻多种方法,还是没有找到C++中能获得显卡使用状况的简单方法,所以这里绕了个弯,把目标转换成了字符串处理. 获取当前设备显卡的基本信息虽然没找到获得显卡运行时的状况的函数,但获取显卡的基本信息是比较常见的.方法如下: #include &amp;lt;cuda_runtime.h&amp;gt; #include &amp;lt;cuda_runtime_api.h&amp;gt; #include &amp;lt;c

优化GPU显存不足，提高GPU利用率

qq_44289607的博客

05-21

1万+

1 常用GPU显存不足时的各种Trick 1)监控GPU 2）估计模型显存 3）显存不足时的Trick 4）提高GPU内存利用率 2 数据处理及算法角度改善（以医学图像分割算法为例） 1 常用GPU显存不足时的各种Trick 1)监控GPU 监控GPU最常用的当然是nvidia-smi，但有一个工具能够更好的展示信息：gpustat nvidia-smi watch --color -n1 gpustat -cpu #动态事实监控GPU 2）估计模...