【线上问题排查】CPU100%和内存100%排查



CPU和内存的排查思路是一样的。

问题模拟代码

先写一段模拟代码,模拟CPU和内存100%的过程

public class PressureTest implements Runnable{
        @Override
        public void run() {
            while (true) {
            }
        }
}
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RestController;

import java.util.LinkedList;
import java.util.List;

/**
 * <p color="orange">
 * 线上问题排查
 * </p>
 *
 * @author BookSea
 * @version 1.0
 * @since 2022/3/27 12:56
 */
@RestController
public class ProblemController {

    /**
     * <p color='orange'>
     * 模拟CPU飙高异常
     * 其中num是计算机的逻辑处理器个数
     * </p>
     *
     * @since 2022/3/27 12:58
     */
    @GetMapping("/cpu/{id}")
    public void cpu(@PathVariable("id") Integer num) {
        System.out.println("----CPU100%---");
        System.out.println("启动" + num + "个线程");
        Thread[] threads = new Thread[num];
        for (int i = 0; i < num; i++) {
            threads[i] = new Thread(new PressureTest());
            threads[i].start();
        }
    }
}

打包部署到服务器。并使用nohup java -jar &运行。

问题复现

这是没请求之前整个系统的状态

在这里插入图片描述
系统正常,shift+p可以按照CPU排序,shift+m可以按照内存排序

先请求下接口

curl http://localhost:8080/cpu/8

此时再看下系统的状态

top -c

可以看到CPU使用率100%直接被打满了。

在这里插入图片描述
找到CPU使用率最高的进程 16253,使用

top -Hp 16253

查看进程里面的线程使用情况。
在这里插入图片描述
可以看到使用率最高的是8个线程,因为我们请求的时候一共请求了8个线程
在这里插入图片描述
线程id分别是:16405~16412

先使用

jstack -l 16253 > ./16253.tdump

导出线程的快照情况。

Dump文件解读

首先,先对我们dump的文件进行一个解读
在这里插入图片描述

首先第一行显示的是dump的时间,第二行是虚拟机的一些信息,接着就是线程的list,包括每个线程的tid。
在这里插入图片描述
这里参考了一张其他博主的图:转载地址

做几点补充:

  1. 如果出现daemon说明是守护线程。
  2. prio 和 os_prio分别是线程jvm优先级,线程操作系统优先级。
  3. tid是jvm线程id,jvm内部线程的唯一标识(可以通过java.lang.Thread.getId()获取)
  4. nid是对应系统线程id(NativeThread ID),和top命令查看的线程pid对应,不过一个是10进制,一个是16进制。
  5. 线程状态是我们要重点关注的,有如下状态:
    在这里插入图片描述
    推荐一篇文章:学会查看jstack Dump 日志

问题排查

用计算器把线程id转为16进制。
在这里插入图片描述
进行查找
在这里插入图片描述
发现线程id 16405~16412 都在PressureTest.java:17这个位置
定位到代码
在这里插入图片描述
我们知道发生了死循环的问题。

工具推荐

自己查看快照信息的话比较不方便,网上有专门分析的平台。
这里推荐3个分析网站,这3个是同一家公司的。

线程Dump分析:http://fastthread.io/
GC日志分析:https://gceasy.io/
Heap Dump分析:https://heaphero.io/

直接上传快照文件就可以,效果是这样的。
在这里插入图片描述

  • 11
    点赞
  • 77
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
引用\[1\]:前几天线上服务器某个Tomcat进程突然间歇性CPU占用率100%,这个并不是突然性的,而是有规律的,Top了一下基本每隔30s飙升一次,坐等5s左右回落。虽然这酱紫,由于是多核CPU,外加其实并没有多少真实用户在访问,也并不影响什么。\[1\] 问题:windows tomcat cpu 100% 回答: 如果在Windows上运行的Tomcat进程出现CPU占用率100%的问题,可以尝试以下步骤进行排查和解决。首先,可以通过任务管理器查看Tomcat进程的详细信息,包括PID(进程ID)。然后,可以使用jstack命令保存Tomcat进程的线程现场信息,例如jstack <PID> > <文件路径>。接下来,可以使用文本编辑器打开保存的文件,搜索高CPU占用的线程ID(通常以16进制表示)。最后,根据搜索到的线程ID,可以进一步分析和解决CPU占用率高的问题。\[2\] #### 引用[.reference_title] - *1* [记一次懵比的Tomcat进程CPU使用率100%](https://blog.csdn.net/weixin_28759725/article/details/119228133)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [线上Java项目cpu突然100%或Tomcat的cpu占用100%](https://blog.csdn.net/Blueeyedboy521/article/details/124145088)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码农BookSea

您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值