目录
1、问题描述:CPU使用率很高,但GPU基本为0。
1.1环境检查
当前环境:python3.8.8+cuda11.7+pytorch2.0.1
使用如下代码进行检查:
import torch
print(torch.__version__)
print(torch.cuda.is_available())
结果显示为ture
>>> import torch
>>> print(torch.__version__)
2.0.1+cu117
>>> print(torch.cuda.is_available())
True
使用设备设置为GPU 0
1.2尝试运行代码
尝试将batch-size调整为128,可以发现GPU是有周期性的变化的,同时GPU-men为2.48g
将调用设备改为cpu,发现一个epoch由原来的2min变为4min,可以确定,前面成功调用了GPU进行训练,因此问题出在了其他部分
1.3解决方案
修改works,works代表数据装载时cpu所使用的线程数,可以看到一个epoch变为了23s!!!