显卡利用率低可能的原因汇总

最新推荐文章于 2025-03-28 23:01:11 发布

minipuding

最新推荐文章于 2025-03-28 23:01:11 发布

阅读量4.6k

点赞数

分类专栏： tensorflow 文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youduba7/article/details/128446989

版权

tensorflow 专栏收录该内容

3 篇文章

订阅专栏

1. 确定是否用到GPU

运行下面命令动态查看GPU使用情况。

watch -n 0.1 nvidia-smi

如果程序运行时，Processes栏有自己的程序名字，说明使用到了GPU。请仔细观察显存Memory-Usage和GPU使用率GPU-Util的情况。

2. 显卡利用率低的可能原因

可以使用IDE软件的Profile工具查看程序的时间花在哪些部分，可能是数据读取、模型训练、以及写日志等等。

数据集的预处理花费时间比较长。相当于GPU要等待CPU处理好数据再计算，所以利用率低；
超内存或者超显存。如果内存和显存太小，计算机自动开辟虚拟内存，那么反复通信的成本很高，利用率低；可以考虑调小batch size试试；
模型原因，有时候会因为模型代码编写不合理，会使得训练时间非常长（我遇到过），比如说模型中有些操作是非tensorflow/pytorch自带的，或者存在resize等耗时操作；
训练时花了大量时间写日志。可以检查一下，是不是日志写的很频繁，或者写的日志包含图片、视频等大文件；否则相当于训练极快，但是都在等你写日志写完再进入下一个step，那利用率肯定低。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。