目录
问题现象
系统的CPU使用率比较高,但是不知道哪个进程, 哪个模块导致的。
问题分解思维导图
工具说明
1. top工具
说明:
统计信息区:
前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。
第一行,任务队列信息,同 uptime 命令的执行结果,具体参数说明情况如下:
22:18:44 — 当前系统时间
up 2 days, 5:33 — 系统已经运行了2天5小时33分钟(在这期间系统没有重启过)
4 users — 当前有4个用户登录系统
load average: 0.37, 0.50, 1.28 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。
第二行,Tasks — 任务(进程),具体信息说明如下:
系统现在共有208个进程,其中处于运行中的有1个,207个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。
第三行,cpu状态信息,具体属性说明如下:
2.7%us — 用户空间占用CPU的百分比。
2.5% sy — 内核空间占用CPU的百分比。
0.0% ni — 改变过优先级的进程占用CPU的百分比
94.8% id — 空闲CPU百分比
0.0% wa — IO等待占用CPU的百分比
0.0% hi — 硬中断(Hardware IRQ)占用CPU的百分比
0.0% si — 软中断(Software Interrupts)占用CPU的百分比
第四行,内存状态,具体信息如下:
2044044k total — 物理内存总量
1102752k used — 使用中的内存总量
941292k free — 空闲内存总量
23268k buffers — 缓存的内存量
第五行,swap交换分区信息,具体信息说明如下:
2095100k total — 交换区总量
224904k used — 使用的交换区总量
1870196k free — 空闲交换区总量
311896k cached — 缓冲的交换区总量
第六行,空行。
第七行以下:各进程(任务)的状态监控,项目列信息说明如下:
PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)
2. lscpu文件系统
此命令用来显示cpu的相关信息。
3. pstack工具
pstack命令可显示每个进程的栈跟踪。
问题定位
1. 查看服务器的负载情况
<1> 通过top命令看下服务器的当前负载情况
top
目前我们看到服务器的负载是比较重的,进程a.out CPU使用量一直将近200%。我们通过lscpu命令看下,cpu最高上限是多少。
目前我们看到CPU是两核,通常情况下最高只能达到200%, 目前看到a.out几乎全占了CPU资源了。
2. 查找使用率最高的进程
<1> 通过top命令查看CPU使用率最高的进程, 按进程的CPU使用率排序
top
运行top命令后,键入大写P。
有两种途径:
a) 打开大写键盘的情况下,直接按P键
b) 未打开大写键盘的情况下,Shift+P键
通过这步分析我找到了最耗CPU的进程是 PID为 26929的进程。
3. 查找进程中线程的CPU使用率, 找到最耗CPU的线程
<1> 使用top命令查看进程中最耗CPU的线程
top -Hp 26929
这个看到进程中一共有4个线程,其中三个都比较耗CPU资源,最后一个基本不耗CPU。怀疑最后一个可能是主线程。主要关注点放到前面三个线程中。
<2> 使用pstack命令查看线程具体在做什么
sudo pstack 26930
sudo pstack 26932
sudo pstack 26931
注: 命令可以不加sudo
通过上述可知a.out进程26930线程, 26932线程, 26931线程中func函数使用CPU资源比较大。下面把源码发出来。
源码
#include <iostream>
#include <thread>
#include "iostream"
#include <bitset>
#include <math.h>
#include <thread>
#include <fstream>
#include <iostream>
#include <unistd.h>
void func() {
while(1) { // 这里耗CPU资源
}
}
int main() {
std::thread t1(func);
std::thread t2(func);
std::thread t3(func);
t1.join();
t2.join();
t3.join();
return 0;
}