线上故障如何快速排查?
文章平均质量分 67
JavaBlackHole
这个作者很懒,什么都没留下…
展开
-
java程序内存占用过高问题排查
一、现象收到线上机器报警(内存使用过高),对报警的机器节点重启后恢复正常,搁天后新的节点又开始报警;二、排查直接对线上机器执行dump命令,由于线上机器还有流量在持续请求,因此dump时间比较长,生成的dump文件有16G+;因此我们先摘除了问题节点的流量,执行dump命令:ps -ef|grep java 获取服务的pidjmap -dump:live,format=b,file=/opt/mydump.hprof 3915 (只dump存活的日志)生成的dump文件13G左右,压原创 2022-04-08 14:50:31 · 8291 阅读 · 0 评论 -
java服务线上故障如何快速排查?
前言线上定位问题时,主要靠监控和日志。一旦超出监控的范围,则排查思路很重要,按照流程化的思路来定位问题,能够让我们在定位问题时从容、淡定,快速的定位到线上的问题。线上问题定位思维导图一 服务器层面1.1 磁盘1.1.1 问题现象当磁盘容量不足的时候,应用时常会抛出的异常信息1.1.2 排查思路1.1.2.1 利用 df 查询磁盘状态利用以下指令获取磁盘状态:df -h结果是:可知/路径下占用量最大。1.1.2.2 利用 du ...转载 2020-11-11 16:07:34 · 784 阅读 · 0 评论