ConcurrentLinkedQueue 引发的现网问题

最新推荐文章于 2024-06-19 13:53:24 发布

Wengy.Xu

最新推荐文章于 2024-06-19 13:53:24 发布

阅读量1.1k

点赞数 3

分类专栏： JAVA 现网查证文章标签： java jdk1.8

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014134750/article/details/118191702

版权

问题排查在公司某次重大活动的保障中，某个组件突然收到了CPU过高的预警（超过80%），收到预警以后，立刻查看监控，发现现网一共10个节点，其中3个节点cpu超过80%，剩余节点cpu正常（cpu不超过60%），并且问题节点的cpu中断数，突然陡增。‘ 疑点一：在同样级别的请求量下，只有3台服务器疑点二：CPU中断数，在某个时间点突然陡增，但上下文切换没有明显变化（如果上下文切换数，和中断数两个同时上升，很有可能是GC的原因导致的）这边首先怀疑是不是6个服务节点，收到的

摘要由CSDN通过智能技术生成

问题排查

在公司某次重大活动的保障中，某个组件突然收到了CPU过高的预警（超过80%），收到预警以后，立刻查看监控，发现现网一共10个节点，其中3个节点cpu超过80%，剩余节点cpu正常（cpu不超过60%），并且问题节点的cpu中断数，突然陡增。‘

疑点一：在同样级别的请求量下，只有3台服务器

疑点二：CPU中断数，在某个时间点突然陡增，但上下文切换没有明显变化 （如果上下文切换数，和中断数两个同时上升，很有可能是GC的原因导致的）

在这里插入图片描述

这边首先怀疑是不是6个服务节点，收到的请求量，不一致。但是，在查了日志后，发现各节点的请求量，基本上是一致的，甚至正常节点的请求量要略高于问题节点（分析，由于cpu高了，导致处理能力下降了）。

在这里插入图片描述

第一个怀疑的是GC问题，通过 jstat 命令查看:

jstat -gcutil [PID] 2000

结果发现 GC 是正常的，full gc次数为0 , yong gc 的频率也不是很高。

继续分析问题，先到问题节点上查看占用cpu比较高的线程：

top -Hp [PID

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
ConcurrentLinkedQueue 引发的现网问题

问题排查在公司某次重大活动的保障中，某个组件突然收到了CPU过高的预警（超过80%），收到预警以后，立刻查看监控，发现现网一共10个节点，其中3个节点cpu超过80%，剩余节点cpu正常（cpu不超过60%），并且问题节点的cpu中断数，突然陡增。‘ 疑点一：在同样级别的请求量下，只有3台服务器疑点二：CPU中断数，在某个时间点突然陡增，但上下文切换没有明显变化（如果上下文切换数，和中断数两个同时上升，很有可能是GC的原因导致的）这边首先怀疑是不是6个服务节点，收到的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。