嵌入式 如何定位死循环或高CPU使用率(linux)

确定是CPU过高

使用top观察是否存在CPU使用率过高现象

找出线程

CPU使用率过高的进程的所有线程进行排序


ps H -e -o pid,tid,pcpu,cmd --sort=pcpu |grep xxx

得到如下结果,其中线程2909使用了7.8%的CPU.


2907 2913 0.0 ./xxx

2907 2909 7.8 ./xxx

也可以通过查看/proc中的信息来确定高CPU线程. 打印了4列,线程ID,线程名,用户时间内核时间(排名未分先后)

awk '{print $1,$2,$14,$15}' /proc/2907/task/*/stat   
root@dvrdvs /proc] # awk '{print $1, $2, $14, $15}' /proc/1341/task/*/stat
 

1340 (ipc_Session1) 209 53
    

……
    

620 (ipc_appweb) 7 18
    

644 (taskVisNetServ) 0 0
    

645 (rf_card_task) 10 11497    //rf_card_task在内核空间消耗CPU时间最多,应用刷卡线程的sleep已经加到800ms
 

646 (card_reader_pro) 323 90
 

647 (security_module) 394 111
 

648 (netBrokenDataRe) 263 812

找出调用栈

使用gdb attach nmsagent所在的进程,在gdb中使用 info threads显示所有线程

gdb

gdb>attach 2907

gdb>info threads

得到如下结果,可以发现2909线程的编号是12


13 Thread 0xad5f2b70 (LWP 2908) 0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1

12 Thread 0xad58eb70 (LWP 2909) 0x006e0422 in __kernel_vsyscall ()

11 Thread 0xad52ab70 (LWP 2910) 0x006e0422 in __kernel_vsyscall ()

10 Thread 0xad4f8b70 (LWP 2911) 0x006e0422 in __kernel_vsyscall ()

9 Thread 0xad4c6b70 (LWP 2912) 0x006e0422 in __kernel_vsyscall ()

8 Thread 0xad3feb70 (LWP 2913) 0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1

7 Thread 0xace08b70 (LWP 2914) 0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1

6 Thread 0xac607b70 (LWP 2915) 0x006e0422 in __kernel_vsyscall ()

5 Thread 0xac5e6b70 (LWP 2916) 0x006e0422 in __kernel_vsyscall ()

4 Thread 0xac361b70 (LWP 2917) 0x006e0422 in __kernel_vsyscall ()

3 Thread 0xac2fdb70 (LWP 2918) 0x006e0422 in __kernel_vsyscall ()

2 Thread 0xac1fcb70 (LWP 2919) 0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1

 1 Thread 0xb78496d0 (LWP 2907) 0x006e0422 in __kernel_vsyscall ()

使用thread 切换线程,使用bt显示线程栈

gdb>thread 12 gdb>bt

得到如下线程栈

#0 0x006e0422 in __kernel_vsyscall ()

#1 0x001cca26 in nanosleep () from /lib/tls/i686/cmov/libc.so.6

#2 0x001fc2dc in usleep () from /lib/tls/i686/cmov/libc.so.6

#3 0x0806b510 in OspTaskDelay ()

#4 0x0805c710 in CDispatchTask::NodeMsgSendToSock() ()

#5 0x0805cc74 in DispatchTaskEntry ()

#6 0x0806a8e9 in OspTaskTemplateFunc(void*) ()

#7 0x00d4780e in start_thread () from /lib/tls/i686/cmov/libpthread.so.0

#8 0x002027ee in clone () from /lib/tls/i686/cmov/libc.so.6 

ps + strace

得到进程ID21465 ps -e |grep cmu 4996 ? 00:00:25 cmu_fjga_sp3 21465 pts/5 00:08:10 cmu

得到线程时间, 其中最占CPU的是EpollRecvTask 21581

ps -eL |grep 21465

21465 21579 pts/5 00:00:00 CamApp

21465 21580 pts/5 00:00:00 TimerMan Task

21465 21581 pts/5 00:09:02 EpollRecvTask

21465 21582 pts/5 00:00:00

使用strace -p 21581 得到线程栈

当前1路发流线程,CPU使用率6.5%,使用strace统计10s内线程主要开销,70%都在writev上。


./strace: Process 1039 attached
    

^C./strace: Process 1039 detached
    

% time     seconds  usecs/call     calls    errors syscall
   

------ ----------- ----------- --------- --------- ----------------
 

 69.18    7.156191         799      8948           writev
 
 
 
 
 

 30.82    3.188340        6215       513           nanosleep
 
 
 

------ ----------- ----------- --------- --------- ----------------
 

100.00   10.344531                  9461           total

和前端内核代码比较后,内核修改系统节拍率1000为100,vmstat查看系统中断次数减少了一倍,发流线程CPU使用率可以降低1%。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值