查看Linux服务器GPU使用情况,以及各种参数解释
查看GPU使用情况
- 静态查看命令
只能看当前这一时刻gpu的各项数据
nvidia-smi
- 动态查看命令
顾名思义,可以实时监测gpu的各项数据。
watch -n 1 nvidia-smi
参数解释
解释相关参数含义:
-
GPU:本机中的GPU编号
-
Name:GPU 类型
-
Persistence-M:驱动常驻模式
-
Fan:风扇转速
-
Temp:温度,单位摄氏度
-
Perf:表征性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能
-
Pwr:Usage/Cap:能耗表示
-
Bus-Id:涉及GPU总线的相关信息;
-
Disp.A:Display Active,表示GPU的显示是否初始化
-
Memory-Usage:显存使用率
-
Volatile GPU-Util:浮动的GPU利用率
-
Uncorr. ECC:关于ECC的东西
-
Compute M.:计算模式
-
Processes 显示每块GPU上每个进程所使用的显存情况。
根据占用的进程查看端口号
由上图可知,占用显存最大进程ID是110909,下面我们看一下这个进程对应的服务的端口号是哪个。
ps -aux | grep 110939
由图可知,PID=110939对应的服务的端口号是7000,反复确认一下该端口号有没有在使用,如果没有使用,可以kill掉(kill前一定要反复确认)。