使用Jstack生产环境OOM排查经历

  • 2021-04-18日,生产服务器主备机器资源报警,进程OOM,下面是排查问题的全过程
  1. 通过top查看到了cpu占用比较高的应用服务,我们的服务器上部署了多个应用,探查到cpu占用率400%;
  2. 使用 ps -mp pid -o THREAD,tid,time |sort -rn 命令查看当前pid 占用资源较高的线程tid并进行排序
  3. 将线程格式转换为16进制后 printf “%x\n” tid
  4. 得到十六进制后的线程tid后使用 jstack pid |grep tid -A 30 查看线程的堆栈信息
  5. 最后发现是一个Socket服务接口在接收输入流时,加了一个InputStream.available(),这个方法是因为链接建立但是数据还在发送中,需要while循环的获取,开发时没有考虑到空包并且客户端未关闭连链接的情况,导致了服务端死循环, 从而导致CPU使用率飙升;
    最后解决方案为主动发送探测包,判断服务端状态如果没有响应主动的关闭链接;
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值