一次有趣的High load average排查暨深刻理解Linux系统负载

本文探讨了Linux系统负载(Load Average)的概念,解释了单核和多核CPU下负载的含义,并深入分析了NFS挂载问题如何导致高负载,尤其是NFS服务器故障时,大量df进程处于不可中断睡眠状态,影响系统性能。通过了解Linux内核源代码,可以更好地理解Load Average的计算方法。
摘要由CSDN通过智能技术生成

当Linux服务运行慢的时候,我们一般都是用top命令看看当前CPU使用率以及哪些进程占用了资源等。资深一些管理员,会通过查看load average来查看系统负载以评估系统是越来越慢还是会越来越快。正常情况下,系统没有活跃进程时,系统的负载是0, 如下所示(用uptime):

# uptime
 03:07am  up   0:38,  2 users,  load average: 0.00, 0.00, 0.02

可是有一次有台机会变慢,load average很高,但是CPU 使用率接近于0,如下所示:

top - 05:15:28 up  2:25,  2 users,  load average: 18.44, 18.47, 18.32
Tasks: 144 total,   1 running, 143 sleeping,   0 stopped,   0 zombie
%Cpu0  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu1  :  0.0 us,  0.8 sy,  0.0 ni, 99.2 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu2  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
%Cpu3  :  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st

如果是使用vmstats/iostat,都没办法发现是什么导致High load average和机器变慢。在大量Google之后,最终怀疑到是因为有一个NFS mount的服务器可能down了,大量的df进程导致系统High load average&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值