一、查看CPU型号
lscpu
二、获取GPU的基本信息
nvidia-smi
输出:
- Memory-Usage:显存使用率(已用显存/最大显存)
- Volatile GPU-Util:GPU使用率
结合监控命令,每秒刷新一次
watch -n 1 -d nvidia-smi
- -n(interval):指定执行命令的间隔时间,默认为2秒
- -d(differences):高亮显示变化的部分
三、获取系统CPU使用率
sar -u -r 1 3
- –u:输出cpu使用情况和统计信息
- -r:报告内存利用率的统计信息
- 1:间隔1秒
- 3:总共获取3次信息
输出:
- %iowait:CPU等待IO的百分比
- %idle:空闲的CPU
- kbmemfree:空闲的物理内存大小
- kbmemused:使用中的物理内存大小
- %memused:物理内存使用率
- kbbuffers:内核中作为缓冲区使用的物理内存大小,kbbuffers和kbcached这两个值就是free命令中的buffer和cache
- kbcached:缓存的文件大小
- kbcommit:保证当前系统正常运行所需要的最小内存,即为了确保内存不溢出而需要的最少内存(物理内存+Swap分区)
- commit:这个值是kbcommit与内存总量(物理内存+swap分区)的一个百分比的值
四、获取IO占用
iostat -d -x -k 1
- -d:显示磁盘使用情况
- -x:显示详细信息
- -k:以 KB 为单位显示
- 1:间隔1秒
输出:
- %util:一秒中有百分之多少的时间用于 I/O 操作,即被I/O消耗的cpu百分比