1、下载gpu_burn,工具
git clone GitHub - wilicc/gpu-burn: Multi-GPU CUDA stress test
2、查看GPU的compute capability
方法1:进入官网查看:
CUDA GPUs - Compute Capability | NVIDIA Developer
方法2:
使用nbody -benchmark 查看ompute capability反馈值
3、解压gpu_burn文件,并进入,make可执行文件
make -j COMPUTE=80
(80:是步骤2得到的ompute capability数值)
4、执行
./gpu_burn -tc 43200
(43200:此数值为时间,单位是秒,4320指的是12小时)
5、查看状态
nvidia-smi:查看所有GPU的TDP到达95%以上
Xcc web: 查看xcc web utilzation中的power utilzation 中记录的TPD值稳定,没有意外下降,如下图: