【线上问题定位】CPU占用率高的元凶

目录

问题现象

问题分解思维导图

工具说明

1. top工具

2.  lscpu文件系统

3. pstack工具

问题定位

1.  查看服务器的负载情况

2. 查找使用率最高的进程

3. 查找进程中线程的CPU使用率, 找到最耗CPU的线程

源码


问题现象

 

系统的CPU使用率比较高,但是不知道哪个进程, 哪个模块导致的。

 

问题分解思维导图

 

 

工具说明

 

1. top工具

说明:

统计信息区:

前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。

 

第一行,任务队列信息,同 uptime 命令的执行结果,具体参数说明情况如下:

22:18:44 — 当前系统时间

up 2 days, 5:33 — 系统已经运行了2天5小时33分钟(在这期间系统没有重启过)

4 users — 当前有4个用户登录系统

load average: 0.37, 0.50, 1.28 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。

load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。

 

第二行,Tasks — 任务(进程),具体信息说明如下:

系统现在共有208个进程,其中处于运行中的有1个,207个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。

 

第三行,cpu状态信息,具体属性说明如下:

2.7%us — 用户空间占用CPU的百分比。

2.5% sy — 内核空间占用CPU的百分比。

0.0% ni — 改变过优先级的进程占用CPU的百分比

94.8% id — 空闲CPU百分比

0.0% wa — IO等待占用CPU的百分比

0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比

0.0% si — 软中断(Software Interrupts)占用CPU的百分比

 

第四行,内存状态,具体信息如下:

2044044k total — 物理内存总量

1102752k used — 使用中的内存总量

941292k free — 空闲内存总量

23268k buffers — 缓存的内存量

 

第五行,swap交换分区信息,具体信息说明如下:

2095100k total — 交换区总量

224904k used — 使用的交换区总量

1870196k free — 空闲交换区总量

311896k cached — 缓冲的交换区总量

 

第六行,空行。

 

第七行以下:各进程(任务)的状态监控,项目列信息说明如下:

PID — 进程id

USER — 进程所有者

PR — 进程优先级

NI — nice值。负值表示高优先级,正值表示低优先级

VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES

RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA

SHR — 共享内存大小,单位kb

S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程

%CPU — 上次更新到现在的CPU时间占用百分比

%MEM — 进程使用的物理内存百分比

TIME+ — 进程使用的CPU时间总计,单位1/100秒

COMMAND — 进程名称(命令名/命令行)

 

2.  lscpu文件系统

此命令用来显示cpu的相关信息。

 

3. pstack工具

pstack命令可显示每个进程的栈跟踪。

 

问题定位

 

1.  查看服务器的负载情况

 

<1> 通过top命令看下服务器的当前负载情况

top

目前我们看到服务器的负载是比较重的,进程a.out CPU使用量一直将近200%。我们通过lscpu命令看下,cpu最高上限是多少。

目前我们看到CPU是两核,通常情况下最高只能达到200%, 目前看到a.out几乎全占了CPU资源了。

 

2. 查找使用率最高的进程

<1> 通过top命令查看CPU使用率最高的进程, 按进程的CPU使用率排序

top运行top命令后,键入大写P。有两种途径:a) 打开大写键盘的情况下,直接按P键b) 未打开大写键盘的情况下,Shift+P键

通过这步分析我找到了最耗CPU的进程是 PID为 26929的进程。

 

3. 查找进程中线程的CPU使用率, 找到最耗CPU的线程

<1> 使用top命令查看进程中最耗CPU的线程

top -Hp 26929

这个看到进程中一共有4个线程,其中三个都比较耗CPU资源,最后一个基本不耗CPU。怀疑最后一个可能是主线程。主要关注点放到前面三个线程中。

 

<2> 使用pstack命令查看线程具体在做什么

sudo pstack 26930sudo pstack 26932sudo pstack 26931

注: 命令可以不加sudo

通过上述可知a.out进程26930线程, 26932线程, 26931线程中func函数使用CPU资源比较大。下面把源码发出来。

 

源码

 

#include <iostream>#include <thread>#include "iostream"#include <bitset>#include <math.h>#include <thread>#include <fstream>#include <iostream>#include <unistd.h>void func() {    while(1) {    // 这里耗CPU资源    }}int main() {    std::thread t1(func);    std::thread t2(func);    std::thread t3(func);    t1.join();    t2.join();    t3.join();    return 0;}

 

分享大数据行业的一些前沿技术和手撕一些开源库的源代码
微信公众号名称:技术茶馆
微信公众号ID    :    Night_ZW
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值