平均负载定义和影响

1. 概念

平均负载:指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数。用人话说,就是指定时间单位内,有多少个可以执行的线程。
我们举个例子:假设你的服务器只有一个进程(单线程),这个进程跑满了CPU(CPU使用率100%),那么你服务器的负载就是1。

2. 负载的影响

负载低:表明该服务器啥都没运行,空闲状态,浪费资源,浪费电。
负载高:多个进程争抢资源(IO/CPU),导致服务响应较慢,影响用户体验。

3. 负载的查看

很简单,top命令即可查看,如图:
在这里插入图片描述
右上角的load average就是平均负载的意思,从左到右分别是1分钟内的平均负载,5分钟内的平均负载,15分钟内的平均负载。
有人说了你的例子看起来负载不是1就是2,这图上咋显示0.12呢?
我们注意了,1分钟内的平均负载是0.12,假设每隔60s统计一次,那么第0秒有一个进程在占用cpu(使用率100%),第60s统计一次,没有进程在用cpu(使用率0%),那么这一分钟内的平均负载就是(0+1)/2 就是0.5,当然这样算下来0.12也很正常。

4. 导致负载变高的原因

在1. 概念中,我们的人话里介绍了,负载表达的是:指定时间单位内,有多少个可以执行的线程。
如何定义可执行的线程呢:

  1. 真的在CPU上执行(线程状态为Running)
  2. CPU不够了,在等待执行(线程状态为Runnable)
  3. CPU在等待资源(状态wait)
    以上三种进程的状态会被归纳到负载里。

所以:

  1. CPU密集型的程序会导致负载急速上升。
  2. IO密集型的程序也会导致负载上升。
  3. 一台机器上布置了大量服务也会导致负载上升。

5. 负载多高才算正常呢

负载越低,表明服务器上的资源越多,还可以部署的服务就越多。负载低时,服务能快速获取资源,服务响应较快。
负载越高,表明服务器上的资源越少,还可以部署的服务就越少。负载高时,进程们争抢资源(IO/CPU),服务响应就会下降。
那么多少的负载才能达到一个资源与服务的平衡呢。
平均负载最理想的情况是等于 CPU 个数,通过以下命令可以知道CPU个数:
grep 'model name' /proc/cpuinfo | wc -l
大致负载达到CPU个数的70%为理想状态,负载再多就该扩容或者优化程序啦。

6. 查找负载高的进程

以前老东家一台机器上就布置一个服务进程,机器负载升高一定是我们的服务影响的。
但新东家整个集群整个公司一起用,虽然有隔离,但还是不可避免的有相互影响。
给大家介绍一个工具:pidstat,注释:坑爹的需要root权限,对于大厂来说,线上机器不可能有这个软件,有root权限的不会出负载问题。
第一步:top
在这里插入图片描述
根据top,第一个红框高代表CPU(user, system)高,第二个红框(IOWait)高代表IO高。
第二步:pdistat
根据第一步分析的到底是IO高还是CPU高。找出IO、CPU高对应的进程,如下:
pidstat -u 5 1
该命令可打印出每个进程的IOWait和CPU,找到CPU/IO高的进程,即可找到对应的进程号啦。

### CPU I/O 负载定义 #### CPU 负载 CPU 负载是指单位时间内系统中等待被调度执行的任务数量。它不仅包括当前正在使用 CPU 的任务,还包括那些已经准备好运行但在队列中等待的任务[^1]。当提到“平均负载”时,通常指的是过去一段时间内的任务队列长度,这可以通过 `uptime` 或者 `top` 命令来观察。 对于多核系统而言,合理的平均负载取决于其 CPU 核心数。一般来说,单核系统的理想平均负载应接近于 1;而对于 n 核系统,则理想的平均负载约为 n 左右。 #### I/O 负载 I/O 负载主要指磁盘或其他外部设备的数据读写请求量。较高的 `%iowait` 表明 CPU 正花费大量时间等待 I/O 操作完成,而此时 CPU 实际上处于闲置状态[^3]。因此,即使 `%idle` 较高,但如果 `%iowait` 显著增加,也可能意味着存在性能瓶颈。 --- ### 如何监控 CPU I/O 负载 #### 使用工具监控 CPU 负载 - **Uptime**: 提供最近 1 分钟、5 分钟以及 15 分钟平均负载情况。 - **Top/htop**: 动态显示各个进程的状态及其消耗资源的情况,并可以查看总的 CPU 利用率(如 `%user`, `%system`, `%idle` 等指标)。通过这些数据能够判断是否有过多的可运行状态 (R) 进程导致高负载[^2]。 #### 监控 I/O 负载的方法 - **vmstat**: 可以用来监测内存、交换区活动以及 I/O 统计信息中的 iowait 时间比例。 - **iostat**: 展现详细的硬盘子系统性能参数,比如每秒传输次数(tps),读取速度(kB_read/s),写入速度(kB_wrtn/s)等。 - **dstat**: 结合多种统计源提供全面实时更新的信息流图示化展示方式更加直观易懂便于分析诊断问题所在之处。 --- ### 优化策略 #### 针对 CPU 密集型工作负载的优化建议 - 减少不必要的计算开销:审查应用程序逻辑找出潜在效率低下部分加以改进; - 并行处理:利用多线程或多进程技术充分利用现代计算机架构下多个物理或逻辑处理器的优势从而提升整体吞吐能力; - 升级硬件配置:考虑更换更快更强大的中央处理器单元(CPU). #### 解决高 I/O 等待现象的办法 - 存储介质升级:SSD相比HDD拥有更高的随机访问速率更低延迟特性适合频繁小文件操作场景应用需求; - 数据库索引调整:确保常用查询路径上有适当建立好的索引来加速检索过程减少全表扫描带来的额外负担 ; - 缓存机制引入:把热点内容缓存到内存里边避免重复从慢速存储媒介获取相同资料造成浪费. ```bash # 示例命令用于安装 stress 测试工具并模拟不同类型的负载 sudo apt-get install -y stress stress --cpu 4 --io 2 --vm 2 --hdd 2 --timeout 60s ``` 上述脚本展示了如何创建四种不同类型的压力条件来进行综合评估环境表现状况以便后续采取针对性措施改善薄弱环节。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值