前言
本文讲述Java项目所在服务器CPU突然飙升100%的问题如何排查,以及分析可能出现的原因。
觉得不错的同学可以加我公众号,会经常分享一些技术干货,以及热点AI和科技新闻
提示:以下是本篇文章正文内容,下面案例可供参考
一、排查步骤
1.1 首先top命令查看服务器cpu等情况
1、使用top命令找出CPU最高的进程pid
top
2、使用top命令+H找出该进程中CPU最高的线程pid
top -p 19663
按H,获取该进程每个线程的内存情况
3、找到内存和cpu占用最高的线程tid,比如19664
4、转为十六进制得到 0x4cd0,此为线程id的十六进制表示
5、执行 jstack 19663|grep -A 10 4cd0,得到线程堆栈信息中 4cd0 这个线程所在行的后面10行,从堆栈中可以发现导致cpu飙高的调用方法
6、查看对应的堆栈信息找出可能存在问题的代码
二、常见原因
-
程序中存在死循环或者长时间占用 CPU 的操作。比如,不合理的递归操作、循环操作等等。
-
程序中存在大量的计算操作,例如复杂的算法、大量的数值计算等等。
-
程序中存在大量的 IO 操作,例如读写文件、网络通信等等。
- IO密集型的程序需要频繁地从磁盘或网络读写数据,这些操作会消耗CPU的时间和资源。
- IO操作不会立即完成,而是需要等待数据准备好或者传输完成,这期间CPU会切换到其他进程或线程,导致上下文切换的开销。
- IO操作会触发中断,中断会打断CPU的正常运行,使得CPU要处理中断请求和恢复执行状态,这也会增加CPU的负担。
- IO操作会影响内存的使用,如果内存不足,会导致虚拟内存的使用,进而增加磁盘IO的压力,形成一个恶性循环。
-
程序中存在大量的线程创建和销毁操作,以及线程间的竞争和同步操作。
-
程序中存在内存泄漏或者内存溢出,导致 JVM 不断进行垃圾回收。
-
程序中存在大量的数据库操作,导致数据库连接池的耗尽和数据库负载过高。
总结
针对这些问题,需要具体情况具体分析,采取相应的优化措施,例如修改代码逻辑、优化算法、降低 IO 操作频率、减少线程创建和销毁、增加 JVM 内存等等。