一、首先说可用工具
1、jmap可以查看当前Java进程的内存占用,把内存快照dump出来
用法:jmap [option] <pid>
常用命令
jmap -heap pid
主要显示堆的内存使用情况,包括分代情况,每个代的总容量、已使用内存、可使用内存,如图:
jmap -dump:live,format=b,file=xxx.xxx [pid]
当前Java进程的内存占用情况导出来,用内存分析工具分析,如MAT
2、jstack可以查看线程运行情况,是否有死锁,cpu过高问题
用法:jstack [option] <pid>
常用命令
jstack -l pid 生成虚拟机当前时刻的线程快照
需要关注的状态:deadlock:死锁,blocked:线程被阻塞,
通过top命令定位到cpu占用率较高的线程之后,接着使用jstack pid命令来查看当前java进程的堆栈状态,将线程id转换成16进制来查看,建议隔段时间再执行一次stack命令,再一次获取thread dump,毕竟两次拍片结果(jstack)对比
3、jstat命令来查看垃圾回收的情况,特别是fullgc
常用命令:
jstat -gc <pid>
参数介绍:
S0C:年轻代中第一个survivor(幸存区)的容量 (字节)
S1C:年轻代中第二个survivor(幸存区)的容量 (字节)
S0U:年轻代中第一个survivor(幸存区)目前已使用空间 (字节)
S1U:年轻代中第二个survivor(幸存区)目前已使用空间 (字节)
EC:年轻代中Eden(伊甸园)的容量 (字节)
EU:年轻代中Eden(伊甸园)目前已使用空间 (字节)
OC:Old代的容量 (字节)
OU:Old代目前已使用空间 (字节)
MC:metaspace(元空间)的容量 (字节)
MU:metaspace(元空间)目前已使用空间 (字节)
CCSC:当前压缩类空间的容量 (字节)
CCSU:当前压缩类空间目前已使用空间 (字节)
YGC:从应用程序启动到采样时年轻代中gc次数
YGCT:从应用程序启动到采样时年轻代中gc所用时间(s)
FGC:从应用程序启动到采样时old代(全gc)gc次数
FGCT:从应用程序启动到采样时old代(全gc)gc所用时间(s)
GCT:从应用程序启动到采样时gc用的总时间(s)
jstat -gc <pid> <n> n 间隔n毫秒打印,可以动态观察
二、再说分析思路
1、如果CPU过高
使用top -Hp <pid>,jstack <pid》,十六进制转换等一顿操作,找到占cpu高的线程,根据堆栈信息可以找到占用CPU最多的线程,定位到具体的方法,分析原因,比如自旋锁、递归等;
另外更多情况是,占用CPU最多的线程是GC线程,这就说明内存使用不当,疯狂fullgc,j将CPU占满,这时候需要分析内存占用。
2、频繁fullgc
如果频繁发生fullgc但是又一直没有出现内存溢出,那么表示fullgc实际上是回收了很多对象了,所以这些对象最好能在younggc过程中就直接回收掉,避免这些对象进入到老年代,对于这种情况,就要考虑这些存活时间不长的对象是不是比较大,导致年轻代放不下,直接进入到了老年代,尝试加大年轻代的大小,如果改完之后,fullgc减少,则证明修改有效。
3、如果已经发生oom
一般生产系统中都会设置当系统发生了OOM时,生成当时的dump文件(-XX:+
HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/local/base),如果没设置,需要设置重启,尝试复现问题。我们可以利用jvisualvm、MAT等工具来分析dump文件,根据dump文件找到异常的实例对象,和异常的线程(占用CPU高),定位到具体的代码,然后再进行详细的分析和调试。
三、最后总结
总之,调优不是一蹴而就的,需要分析、推理、实践、总结、再分析,最终定位到具体的问题。