每一位开发想必都会遇到线上服务告警,而导致这样原因的肯能有流量增加或是代码中bug异常没有抓住导致,而此刻我们就需要去排查问题。
1:业务增加,导致FGC频繁发送,如果不知道如何查看FGC的话,可以参考之前写的:Jstat查看MinorGC和FGC使用详解,点击即可。这里不做重新复述。当发现FGC的次数频繁很高,这里说明了需要优化JVM来减少FGC的次数;而这种问题不是个人原因导致的线上问题,所有一带而过。
2:个人代码导致的服务告警,如何排查:
第一步:我想普遍都是先使用Top来查看CPU的使用率:
第二步:找出cup使用最高的pid 也就是第一列,然后jstack pid |fgrep pid(这里需要转16进制 printf “%x\n”)
这里解释一下jstack的结果:
关于线程状态需要关注的有;
死锁 Deadlock ;等待资源,Waiting on condition;等待获取监视器,