任务背景:在使用YOLOv5的过程中,使用DDP模式时,对其相关操作记录如下
一、查看服务器显卡使用情况
nvidia-smi
怎么看呢?具体参数含义如下:
- GPU:GPU 编号;
- Name:GPU 型号;
- Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
- Fan:风扇转速,从0到100%之间变动;
- Temp:温度,单位是摄氏度;
- Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
- Pwr:Usage/Cap:能耗;
- Memory Usage:显存使用率;
- Bus-Id:涉及GPU总线的东西
- Disp.A:Display Active,表示GPU的显示是否初始化;
- Volatile GPU-Util:浮动的GPU利用率;
- Uncorr. ECC:Error Correcting Code,错误检查与