linux cpu使用率500%,Linux:CPU使用率100%排查方法

本文详细介绍了Linux操作系统的多任务处理机制,CPU时间片分配以及全局变量Jiffies的角色。CPU使用率涉及用户态、内核态、空闲时间和I/O等待时间等关键指标。通过ps、top、pidstat等工具可以监控和分析CPU使用情况。当CPU使用率过高时,可以使用perf工具定位到具体函数进行性能优化。
摘要由CSDN通过智能技术生成

Linux做为一个多任务操做系统,将每一个CPU的时间划分为很短的时间片,再经过调度器轮流分配给各个任务使用,所以形成多任务同时运行的错觉。

CPU使用率

Linux做为一个多任务操做系统,将每一个CPU的时间划分为很短的时间片,再经过调度器轮流分配给各个任务使用,所以形成多任务同时运行的错觉。

为了维护CPU时间,Linux经过事先定义的节拍率(内核中表示为HZ),触发时间中断,并使用全局变量Jiffies记录了开机以来的节拍数。每发生一次时间中断,Jiffies的值就加1。

节拍率HZ是内核的可配选项,能够自定义配置,可经过/boot/config来查询linux

$ grep 'CONFIG_HZ=' /boot/config-$(uname -r)

CONFIG_HZ=1000

CPU使用率有不少重要指标,具体含义以下:函数

user(一般缩写为us),表明用户态CPU时间。注意,它包括下面的nice时间,但包括了guest时间。工具

nice(一般缩写为ni),表明低优先级用户态CPU时间,也就是进程的nice值被调整为1-19之间是的CPU时间。性能

system(一般缩写为sys),表明内核态CPU时间优化

idle(一般缩写为id),表明空闲时间。注意,它不包括I/O等待时间(iowait)操作系统

iowait(一般缩写为wa),表明等待I/O的CPU时间3d

irq(一般缩写为hi),表明处理硬中断的CPU时间code

softirq(一般缩写为si),表明处理软中断的CPU时间对象

steal(一般缩写为st),表明当系统运行在虚拟机中的时候,被其余虚拟机占用的CPU时间blog

guest(一般缩写为guest),表明经过虚拟化运行其余操做系统的时间,也就是运行虚拟机的CPU时间

而咱们一般所说的CPU使用率,就是除了空闲时间外的其余时间占总CPU时间的百分比,用公式表示为:

c79c6e3f16a7c366c4586a15eed0fed0.png

上面这个计算方式是不具有参考意义的,由于总CPU时间是机器开机以来的,事实上,为了计算CPU使用率,性能工具都会取间隔一段时间(好比5秒)的两次值,作差后,再计算出这段时间内的平均CPU使用率,即:

17d2019289582e4d8b09db76b015861d.png

不过须要注意的是,性能分析工具给出的都是间隔一段时间的平均CPU使用率,因此要注意间隔时间的设置,特别是多个工具对比分析时,须要保证它们的间隔时间是相同的。

好比,对比一下top和ps这两个工具报告的CPU使用率,默认的结果可能不同,由于top默认使用3秒时间间隔,而ps使用的倒是进程的整个生命周期。

查看CPU使用率的方法

知道了cpu使用率的含义后,咱们再来看看要怎么查看CPU使用率,说道查看cpu使用率性能工具,首先会想到ps、top。

top显示了系统整体的CPU和内存使用状况,以及各个进程的资源使用状况

ps则是显示了每一个进程的资源使用状况

好比,top的输出格式:

16092031a2bd1e626e4efd8c60c4afb0.png

须要注意的,top默认显示的全部CPU的平均值,这个时候只须要按下数字1,就能够切换到每一个CPU的使用率了。

继续往下看,空白行以后是进程的实时信息,每一个进程都有一个%CPU列,表示进程的CPU使用率,它是用户态和内核态CPU使用率的总和,包括进程用户空间、使用的CPU、经过系统调用执行的内核空间CPU、以及在就绪队列等待运行的CPU。

分析进程的命令,好比pidstat,改命令包括:

用户态CPU使用率(%user)

内核态CPU使用率(%system)

运行虚拟机CPU使用率(%guest)

等待CPU使用率(%wait)

以及总的CPU使用率(%CPU)

1823db04357b91032034c07aba0d152c.png

CPU使用率太高怎么办

经过top、ps、pidstat等工具,能够找到具体的进程,但若是还想知道是代码中的哪一个函数呢?找到它,才能更高效、更有针对性地进行优化

推荐使用系统内置的perf工具,它以性能事件采样做为基础,不只能够分析系统的各类事件和内核性能,还能够用来分析指定应用程序的性能问题。

第一种经常使用方法是perf top

aea750cb1b295c0253129f79d0c7a29d.png

输出结果中,第一行包含三个数据,分别是采样数(Samples)、事件类型(Event)和事件总数量(Event count)。

再往下看是一个表格数据,每一行包含四列,分别是:

第一列Overhead,是该符号的性能事件在全部采样中的比例,用百分比表示

第二列Shared,是该函数或指令所在的动态共享对象,如内核、进程名、动态连接库名等

第三列Object,是动态共享对象的类型,好比[.]表示用户空间可执行程序、或者动态连接库,而[k]则表示内核空间

最后一列Symbol是符号名,也就是函数名。当函数名未知时,用十六进制的地址表示

第二种用法,就是perf record和perf report。perf top虽然实时展现了系统的性能信息,但它的缺点是并不保存数据,也就是没法用于离线或者后续的分析,而record则提供了保存数据的功能,保存数据后,使用perf report解析展现。

5ed9c3e12a9ad55122a6c1ccb2413e16.png

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值