怎么理解“平均负载“

系统变慢时,常做的第一件事就是执行top或者uptime命令,来了解系统的负载情况。

最后三个数字呢,一次是过去1分钟、5分钟、15分钟的平均负载(Load Average)

man uptime可以看到解释,平均负载是 单位时间 处于运行态 和 不可中断态 的平均进程数,它和CPU使用率并没有直接关系。

运行态进程: 是 使用cpu或者等待使用cpu。 (ps命令看到的R状态(running或runnable))

不可中断态:比如等待硬件设备的I/O响应 (ps命令看到的D状态 (Uninterrptible Sleep,也称为Disk Sleep)的进程)

比如,当一个进程向磁盘读写数据时,为了保证数据的一致性,在得到磁盘回复前,它是不能被其他进程或者中断打断的,这个时候的进程就处于不可中断状态。如果此时的进程被打断了,就容易出现磁盘数据与进程数据不一致的问题。

所以,不可中断状态实际上是系统对进程和硬件设备的一种保护机制。

既然平均的是活跃进程数,那么最理想的,就是每个 CPU 上都刚好运行着一个进程,这样每个 CPU 都得到了充分利用。比如当平均负载为 2 时,意味着什么呢?

• 在只有 2 个 CPU 的系统上,意味着所有的 CPU 都刚好被完全占用。

• 在 4 个 CPU 的系统上,意味着 CPU 有 50% 的空闲。

• 而在只有 1 个 CPU 的系统中,则意味着有一半的进程竞争不到 CPU。

• 我们知道,平均负载最理想的情况是等于 CPU 个数。所以在评判平均负载时,首先你要知道系统有几个 CPU,这可以通过 top 命令或者从文件 /proc/cpuinfo 中读取

单位时间内 CPU 繁忙情况的统计,跟平均负载并不一定完全对应。比如:

• CPU 密集型进程,使用大量 CPU 会导致平均负载升高,此时这两者是一致的;

• I/O 密集型进程,等待 I/O 也会导致平均负载升高,但 CPU 使用率不一定很高;

• 大量等待 CPU 的进程调度也会导致平均负载升高,此时的 CPU 使用率也会比较高。

用mpstat -d 可以看进程的io

用mpstat -P all 5可以看出所有进程的cpu计算、I/O等待、进程调度,确定出是由于计算还是I/O、进程调度引起的平均负载高

然后用pidstat定位到问题进程

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值