CPU过高问题如何定位?
本文,我们来聊一下对于CPU过高问题如何定位。
如果我们CPU占用率非常高,那么该怎样去定位哪段代码导致CPU过高呢?
我们一般可以采用两种方式定位这种问题。
top+jstack
top命令是linux中常用的命令,可以查看CPU的运行情况,比如查看CPU占用率,内存使用率等等。
我们来演示一下:
我们可以看到39331这个进程占用率最高,占用率为0.7%
接着我们执行top -Hp 30331
然后就可以显示出当前进程里面线程的运行信息
我们可以看出来,29537这个线程是占用率最高的。
然后我们使用printf %x 29537
把29537转换成16进制。
最后我们用jstack 去Dump CPU过高的进程。
jstack 29331 > 1.txt
输出到1.txt这个文件里
然后执行 cat 1.txt | grep -A 30 7361
这个命令的意思是在1.txt里面搜索包含7361的这一行,并往后搜索30行。
这样我们就可以看到出问题的线程,是MQ-AsyncArrayDispatcher-Thread-ad17fb67-0f1c-4183-9169-61a4ca5cdb241这个线程。
并定位到有问题的代码。调研发现原来我的项目用了阿里云的MQ消息服务,在这里开启了一个守护线程为每个新创建的topic 提供一些系统的记录功能。
我们简单总结一下这种方式:
- 通过top命令找到CPU占用率最高的进程
- 再使用top -Hp [pid] 找到进程里各个线程的CPU占用率
使用top -Hp 拿到的进程号是10进制的,需要转换成16进制。 - 接着我们使用jstack去Dump线程
- jstack Dump出来的线程 用 2 中的线程号查询
- 找到有问题的代码。
JMC
通过JMC的可视化面板也可以查看每个线程的CPU占用率,这里对于JMC就不做详细探讨了,感兴趣的同学可以自行查阅资料。
可能导致CPU占用率过高的场景与解决方案
-
无限while循环
- 尽量避免无限循环
- 让循环执行的慢一点
-
频繁GC
这种情况也可能导致CPU占用过高,大家想,垃圾收集非常频繁的话,说明内存分配特别快,很快相应的内存区域就满了,进而导致下一次的GC,频繁GC就意味着垃圾收集线程被频繁的执行,导致CPU的飙升。- 降低GC频率
-
频繁创建新对象
- 合理使用单例
-
序列化和反序列化
- 使用合理的API实现功能
-
正则表达式
这是因为正则表达式使用了一个叫做NFA自动机的引擎,这种引擎在进行字符串匹配的时候会发生回溯,而一旦发生回溯就可能导致CPU占用过高的问题。
感兴趣的朋友可以看下这篇文章《正则表达式和 CPU 100%有什么故事?》 -
频繁的线程上下文切换
比如我们的应用有很多的线程,这些线程在做争抢,线程的状态总是在Block 和 Running之前切换,而一旦切换特别频繁的话就会导致CPU占用过高。
* 降低切换的频率