平均负载(Load Average)
当我们输入uptime
命令时,
这里有几个参数,解释如下
0:54
:当前时间;up 50 mins
:系统运行时间;2 users
:正在登录用户数;load averages: 2.12 1.85 1.81
:平均负载;
这里平均负载是什么含义?
平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数。
输入命令ps aux
,可以看到进程的PID,CPU使用率,以及进程状态等等信息,
- 可运行的进程:指正在使用CPU或者正在等待CPU的进程,即上面STAT为R(Running/Runnable)状态的进程;
- 不可中断状态的进程:正处于内核态关键流程中的进程,并且这些流程是不可打断的,比如最常见的是等待硬件设备的I/O响应,也就是STAT为D(Uninterruptible Sleep,也称为Disk Sleep)状态的进程;
平均负载多少合理
平均负载最理想的情况是等于CPU个数。
先查看系统有几个CPU,Linux系统可以通过top命令或文件/proc/cpuinfo中获取CPU个数,
本机输入下列命令查看基本信息:
sysctl hw.physicalcpu
:查看物理CPU个数;sysctl hw.logicalcpu
:查看逻辑CPU个数;system_profiler SPHardwareDataType
:查看硬件信息总揽;
可以看出平均负载接近理想,三个数值是在三个不同时间间隔(1分钟总、5分钟、15分钟)的平均值。从数值上看系统负载较平稳。
使用top
命令也可以查看平均负载的值,如下,
当平均负载高于CPU数量70%的时候,就需要排查负载高的问题了。一旦负载过高,可能导致进程响应变慢,进而影响服务的正常功能。
平均负载与CPU使用率
它不仅包括了正在使用CPU的进程,还包括等待CPU和等待I/O的进程。
CPU使用率是单位时间内CPU繁忙情况的统计,和平均负载不一定完全对应,
- CPU密集型进程:使用大量CPU会导致平均负载升高,两者一致;
- I/O密集型进程:等待I/O也会导致平均负载升高,但CPU使用率不一定高;