线上问题排查
1、线上OOM如何排查?
OOM是out of memory,是内存溢出,来源于java.lang.OutOfMemoryError,当JVM因为没有足够的内存来为对象分配空间并且垃圾回收器也已经没有空间可回收时,就会抛出这个error。查看当前swap交换空间是否已经使用,一般的流程为系统正常分配内存,当内存不足的时候会使用交换空间swap,swap耗尽时候系统出于保护的目的对使用内存大的程序会执行oom killer。
cat /var/log/kern|grep memory
ps -ef | grep 服务名
ps -aux | grep 服务名
cat -n xxx_log |grep “OutOfMemoryError”
-n 或–number:由1 开始对所有输出的行数编号。
得到dump文件hprof然后使用MAT分析
2、线上CPU100%如何排查?
top: 查看所有进程的CPU使用情况,找到最大的进程ID。
top -H -p pid: 查看指定进程中每个线程的资源占用情况(每条线程占用CPU时间的百分比)。
jstack 17499 > ./threadDump.log: 将线程堆栈信息输出到当前目录下的 threadDump.log 文件。
注意:jstack 打印出的线程id号为十六进制,而 top 命令中打印出来的线程号为十进制,需要进行转换后,定位指定线程的堆栈信息
3、线上死锁如何排查?
排查思路与上面类似