JavaDump
Java虚拟机的运行时快照。将Java虚拟机运行时的状态和信息保存到文件
线程Dump
包含所有线程的运行状态。纯文本格式。
堆Dump
包含线程Dump,并包含所有堆对象的状态。二进制格式。
制作JavaDump
JVM参数
-XX:+HeapDumpOnOutOfMemoryError
指示虚拟机在发生内存不足错误时,自动生成堆Dump
命令行制作
在JDK的bin目录下,包含了java命令及其他实用工具
- jps:查看本机的Java进程信息
使用jps查看Java进程ID(PID);Linux下还可以使用ps命令
jps
jps -l
jps -v
ps -ef|grep java
- jstack:打印线程的栈信息,制作线程Dump。
jstack <进程ID> >> <输出文件>
jstack 2316 >> c:\thread.txt
## Linux下使用Kill命令制作线程Dump,输出线程Dump到目标Java进程的标准输出
kill -quit <进程ID>
kill -3 <进程ID>
- jmap:打印内存映射,制作堆Dump
使用jmap命令制作堆Dump
# 打印存活的对象大小和个数
jmap -histo:live <pid>
# 二进制方式存储堆文件
jmap -dump:format=b,file=文件名.hprof <进程ID>
-
jconsole:简易的可视化控制台
-
jvisualvm:功能强大的控制台
-
jstat:性能监控工具
jstat显示java进程的堆内存使用情况和GC情况
jstat -gcutil -pid 100 10
S0 — Heap上的 Survivor space 0 区已使用空间的百分比
S1 — Heap上的 Survivor space 1 区已使用空间的百分比
E — Heap上的 Eden space 区已使用空间的百分比
O — Heap上的 Old space 区已使用空间的百分比
P — Perm space 区已使用空间的百分比
YGC — 从应用程序启动到采样时发生 Young GC 的次数
YGCT – 从应用程序启动到采样时 Young GC 所用的时间(单位秒)
FGC — 从应用程序启动到采样时发生 Full GC 的次数
FGCT – 从应用程序启动到采样时 Full GC 所用的时间(单位秒) -- 总的fullgc时间
GCT — 从应用程序启动到采样时用于垃圾回收的总时间(单位秒)
- jhat:内存分析工具
分析线程dump
线程Dump的内容
制作时间
Java 版本
线程信息:名称、优先级、标识、状态、堆栈
死锁信息:存在直接Java线程的死锁时才包含。
内存信息:使用kill制作时才包含。
堆栈顶部地址: 上图中Object.wait() [0x000000006aecf000] 或者runnable [0x00007f3f04a28000] 或者waiting on condition [0x00007f3f0492b000] 方括号内的就是顶部地址。每个任务处理完成前不会改变
线程信息
线程状态
NEW: 未启动的。不会出现在Dump中。
RUNNABLE: 在虚拟机内执行的。
BLOCKED: 受阻塞并等待监视器锁。
WATING: 无限期等待另一个线程执行特定操作。
TIMED_WATING: 有时限的等待另一个线程的特定操作。
TERMINATED: 已退出的。
监视器(Monitor)
当使用synchronized定义同步块时时,监视器是用来控制对象的锁的并发访问的结构。
synchronized(obj){
// 同步块,只允许一个线程进入
}
synchronized void method(){
// 同步块,只允许一个线程进入
}
监视器:对象锁的访问控制结构。也指对象的锁。
监视器项:线程的代理人。
进入区:表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则进入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。
拥有者:表示某一线程成功竞争到对象锁。
等待区:表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。
调用修饰
locked <地址> 目标
waiting to lock <地址> 目标
waiting on <地址> 目标
parking to wait for <地址> 目标
实例锁: (a 类名)——synchronized对象。
类锁:(a Class for 类名)——静态synchronized方法
- locked
通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。
at oracle.jdbc.driver.PhysicalConnection.prepareStatement
- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)
at oracle.jdbc.driver.PhysicalConnection.prepareStatement
- locked <0x00002aab63bf7f58> (a oracle.jdbc.driver.T4CConnection)
at com..datasource.PooledConnection.prepareStatement
synchronized (conn) { // conn的类型是T4CConnection
// 同步块操作
}
- waiting to lock
通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为Blocked。
at com..impl.CacheHolder.isVisibleIn(CacheHolder.java:165)
- waiting to lock <0x0000000097ba9aa8> (a CacheHolder)
at com..impl.CacheGroup$Index.findHolder
at com..impl.ContextImpl.find
at com..BaseDataCenter.findInfo
synchronized (holder) { // holder的类型是CacheHolder
// 临界区操作
}
- waiting on
通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进去对象的等待区等待。在调用栈顶出现,线程状态为WAITING或TIMED_WATING。
at java.lang.Object.wait(Native Method)
- waiting on <0x00000000da2defb0> (a WorkingThread)
at com..WorkingManager.getWorkToDo
- locked <0x00000000da2defb0> (a WorkingThread)
at com..WorkingThread.run
synchronized(thread) {
// 同步块操作……
try {
thread.wait();
catch(InterruptException e) { /* 中断异常处理 */ }
}
- parking to wait for
at sun.misc.Unsafe.park(Native Method)
- parking to wait for <0x00000000eb8f35c8> (a FutureTask$Sync)
at java.util.concurrent.locks.LockSupport.park(LockSupport:156)
...
at java.util.concurrent.locks.ReentrantReadWriteLock$WriteLock.lock()
park是基本的线程阻塞原语,不通过监视器在对象上阻塞。
随concurrent包会出现的新的机制,与synchronized体系不同。
synchronized模型相关的调用修饰
- locked <对象地址> (a 类名)
使用synchronized申请对象锁成功,监视器的拥有者。
- waiting to lock <对象地址> (a 类名)
使用synchronized申请对象锁未成功,在进入区等待。
- waiting on <对象地址> (a 类名)
使用synchronized申请对象锁成功后,释放锁并在等待区等待
线程动作
runnable:状态一般为RUNNABLE。
in Object.wait():等待区等待,状态为WAITING或TIMED_WAITING。
waiting for monitor entry:进入区等待,状态为BLOCKED。
waiting on condition:等待区等待、被park。
sleeping:休眠的线程,调用了Thread.sleep()。
分析线程Dump的工具
- Thread Dump Analyzer (TDA)
可直接加载控制台输出,分析出多个线程Dump。
方便的查看各线程的运行状态,调用栈等信息。
查看异常的监视器及相关线程。
提供过滤器定位指定的线程。
- IBM Thread and Monitor Dump Analyzer (TMDA)
能够分析虚拟机线程的统计信息。
能够方便查看监视器信息及相关依赖的线程。
能够比较多个线程Dump的线程信息,及监视器信息
分析模式
wait on monitor entry 被阻塞的,肯定有问题
runnable 注意IO线程
in Object.wait() 注意非线程池等待
虚拟机执行Full GC时,会阻塞所有的用户线程。因此,即时获取到同步锁的线程也有可能被阻塞。
"wss-635" waiting for monitor entry
java.lang.Thread.State: BLOCKED (on object monitor)
at com..impl.CacheHolder.isVisibleIn(CacheHolder.java:165)
- locked <0x0000000097ba9aa8> (a com..CacheHolder)
如何找到耗用cpu资源的线程
Liunx系统可以使用ps H -eo user,pid,ppid,tid,time,%cpu,cmd --sort=%cpu 输出线程信息,可以将这些信息输出到文本文件以便核对。
在执行ps命令时,同时做线程dump,然后把ps命令中的tid十进制转换为16进制与线程dump中的nid匹配,就能分析出什么线程在占用大量cpu
分析堆Dump
Java虚拟机的内存模型
三块:年轻代、年老代、永久代。
新创建的对象放在年轻代。
年轻代垃圾回收后,残余的对象会被移动到年老代。
永久代存放类信息等,一般不会被回收。
堆内存可细分为年轻代(新生代)与年老代(旧生代),年青代又可细分为一个Eden区和两个Survivor区(S0,S1),可通过-XX:SurvivorRatio=8设置Eden区和Survivor区大小,S0:S1:Eden的比例是1:1: 8
对象新创建时,都会分配在Eden区,Eden区满后,会触发young gc,清空Eden区,并将仍存活的对象copy到一个Survivor区,下次young gc时,会将Eden区存活的对象和Survivor区存活的对象一块copy到另一个Survivor区,如此循环,总会保证有一个Survivor区是空的,每在Survivor区熬过1次young gc,则对象年龄增加1岁,默认当年龄增加到15岁时(可通过-XX:MaxTenuringThreshold=15设置),若对象仍存活,则会被转移到年老代,当年老代内存满时则会触发full gc。
垃圾回收(GC)的介绍
- YoungGen GC,新生代回收,Minor GC针对年轻代的回收。毫秒级别
- Full GC,全回收,Major GC针对全虚拟机内存——包括年轻代、年老代、永久代——的回收。秒级别。会暂停虚拟机的线程
垃圾回收根、对象的保留大
从垃圾回收根开始,不再被引用到的对象即为垃圾对象
GC Root一般为线程、会话等对象
从对象上,能递归引用到的对象的合计大小
非准确数,循环引用等造成
内存不足的错误
OutOfMemoryError年老代内存不足。
OutOfMemoryError:PermGen Space永久带内存不足。
OutOfMemoryError:GC overhead limit exceed垃圾回收时间占用系统运行时间的98%或以上。
分析工具
使用MAT分析堆Dump,查看LeakSuspect及DominatorTree。阅读代码,确定对象引用的错误关联而导致的生命周期错误
MAT下载地址
使用飞行记录
-
飞行记录启动参数
-XX:+UnlockCommercialFeatures -XX:+FlightRecorder -XX:FlightRecorderOptions=defaultrecording=true -
飞行记录制作参数:
jcmd PID JFR.start duration=300s filename=2018-12-12-01.jfr settings=profile
settings=profile这个参数必须加,不加会使用默认模板制作,有些参数无法收集到
飞行记录主要关注几点:TLAB\垃圾回收\线程转储
TLAB
TLAB的全称是Thread Local Allocation Buffer,即线程本地分配缓存区,这是一个线程专用的内存分配区域。TLAB是每个线程独有的,大部分的不需要共享的对象是可以直接在该区直接分配空间的,这样GC也方便。但是遇到大对象时就需要存在Eden区中。