前言:去年看过深入理解JVM前5个章节,觉得比较乏味,也没有再往后看了。偶然在网上了解到JProfiler这款工作,遂了解一下…好像确实非常好用… 看着这篇文章还不错转载一下,以下是转载内容:
L-Larry_Lau@163.com#36573-fdkscp15axjj6#25257 L-Larry_Lau@163.com#5481-ucjn4a16rvd98#6038 L-Larry_Lau@163.com#99016-hli5ay1ylizjj#27215 L-Larry_Lau@163.com#40775-3wle0g1uin5c1#0674 L-Larry_Lau@163.com#7009-14frku31ynzpfr#20176 L-Larry_Lau@163.com#49604-1jfe58we9gyb6#5814 L-Larry_Lau@163.com#25531-1qcev4yintqkj#23927 L-Larry_Lau@163.com#96496-1qsu1lb1jz7g8w#23479 L-Larry_Lau@163.com#20948-11amlvg181cw0p#171159
一.JProfiler是什么
JProfiler是由ej-technologies GmbH公司开发的一款性能瓶颈分析工具(该公司还开发部署工具)。 其特点:
使用方便 界面操作友好 对被分析的应用影响小 CPU,Thread,Memory分析功能尤其强大 支持对jdbc,noSql, jsp, servlet, socket等进行分析 支持多种模式(离线,在线)的分析 跨平台 (图1)
二.数据采集
Q1. JProfiler既然是一款性能瓶颈分析工具,这些分析的相关数据来自于哪里? Q2. JProfiler是怎么将这些数据收集并展现的?
(图2)
A1. 分析的数据主要来自于下面俩部分 1. 一部分来自于jvm的分析接口**JVMTI**(JVM Tool Interface) , JDK必须>=1.6
JVMTI is an event-based system. The profiling agent library can register handler functions for different events. It can then enable or disable selected events
例如: 对象的生命周期,thread的生命周期等信息 2. 一部分来自于instruments classes(可理解为class的重写,增加JProfiler相关统计功能) 例如:方法执行时间,次数,方法栈等信息
A2. 数据收集的原理如图2 1. 用户在JProfiler GUI中下达监控的指令(一般就是点击某个按钮) 2. JProfiler GUI JVM 通过socket(默认端口8849),发送指令给被分析的jvm中的JProfile Agent。 3. JProfiler Agent(如果不清楚Agent请看文章第三部分"启动模式") 收到指令后,将该指令转换成相关需要监听的事件或者指令,来注册到JVMTI上或者直接让JVMTI去执行某功能(例如dump jvm内存) 4. JVMTI 根据注册的事件,来收集当前jvm的相关信息。 例如: 线程的生命周期; jvm的生命周期;classes的生命周期;对象实例的生命周期;堆内存的实时信息等等 5. JProfiler Agent将采集好的信息保存到**内存**中,按照一定规则统计好(如果发送所有数据JProfiler GUI,会对被分析的应用网络产生比较大的影响) 6. 返回给JProfiler GUI Socket. 7. JProfiler GUI Socket 将收到的信息返回 JProfiler GUI Render 8. JProfiler GUI Render 渲染成最终的展示效果
三. 数据采集方式和启动模式
A1. JProfier采集方式分为两种:Sampling(样本采集)和Instrumentation
Instrumentation: 在class加载之前,JProfier把相关功能代码写入到需要分析的class中,对正在运行的jvm有一定影响。优点: 功能强大,但如果需要分析的class多,那么对应用影响较大,一般配合Filter一起使用。所以一般JRE class和framework的class是在Filter中通常会过滤掉。
注: JProfiler本身没有指出数据的采集类型,这里的采集类型是针对方法调用的采集类型 。因为JProfiler的绝大多数核心功能都依赖方法调用采集的数据, 所以可以直接认为是JProfiler的数据采集类型。
A2: 启动模式:
Profile at startup 在被分析的jvm启动时,将指定的JProfiler Agent手动加载到该jvm。JProfiler GUI 将收集信息类型和策略等配置信息通过socket发送给JProfiler Agent,收到这些信息后该jvm才会启动。 在被分析的jvm 的启动参数增加下面内容: 语法: -agentpath:[path to jprofilerti library] 【注】: 语法不清楚没关系,JProfiler提供了帮助向导. (图3)
Prepare for profiling: 和Profile at startup的主要区别:被分析的jvm不需要收到JProfiler GUI 的相关配置信息就可以启动。
Offline profiling 一般用于适用于不能直接调试线上的场景。Offline profiling需要将信息采集内容和策略(一些Trigger, Trigger请参考文章第五部分)打包成一个配置文件(config.xml),在线上启动该jvm 加载 JProfiler Agent时,加载该xml。那么JProfiler Agent会根据Trigger的类型会生成不同的信息。例如: heap dump; thread dump; method call record等 语法: -agentpath:/home/2080/jprofiler8/bin/Linux -x64/libjprofilerti.so=offline,id=151,config=/home/2080/config.xml 【注】: config.xml中的每一个被分析的jvm的采集信息都有一个id来标识。 下面是使用了离线模式,并使用了每隔一秒dump heap 的Trigger:
四. JProfiler核心概念
Filter: 什么class需要被分析。分为包含和不包含两种类型的Filter。 (图4)
Profiling Settings: 收据收集的策略:Sampling和 Instrumentation,一些数据采集细节可以自定义. (图5)
Triggers: 一般用于**offline**模式,告知JProfiler Agent 什么时候触发什么行为来收集指定信息. (图6)
Live memory: class/class instance的相关信息。 例如对象的个数,大小,对象创建的方法执行栈,对象创建的热点。 (图7)
Heap walker: 对一定时间内收集的内存对像信息进行静态分析,功能强大且使用。包含对象的outgoing reference, incoming reference, biggest object等 (图8)
CPU views: CPU消耗的分布及时间(cpu时间或者运行时间); 方法的执行图; 方法的执行统计(最大,最小,平均运行时间等) (图9)
Thread: 当前jvm所有线程的运行状态,线程持有锁的状态,可dump线程。 (图10)
Monitors & locks: 所有线程持有锁的情况以及锁的信息 (图11)
Telemetries: 包含heap, thread, gc, class等的趋势图(遥测视图)
五. 实践
为了方便实践,直接以JProfiler8自带的一个例子来帮助理解上面的相关概念。 JProfiler 自带的例子如下:模拟了内存泄露和线程阻塞的场景: 具体源码参考: /jprofiler install path/demo/bezier
(图12 )
(图13 Leak Memory 模拟内存泄露, Simulate blocking 模拟线程间锁的阻塞)
A1. 首先来分析下内存泄露的场景:(勾选图13中 Leak Memory 模拟内存泄露) 1. 在**Telemetries-> Memory**视图中你会看到大致如下图的场景(在看的过程中可以间隔一段时间去执行Run GC这个功能):看到下图蓝色区域,老生代在gc后(**波谷**)内存的大小在慢慢的增加(理想情况下,这个值应该是稳定的) (图14)
在 Live memory->Recorded Objects 中点击**record allocation data**按钮,开始统计一段时间内创建的对象信息。执行一次**Run GC**后看看当前对象信息的大小,并点击工具栏中**Mark Current**按钮(其实就是给当前对象数量打个标记。执行一次Run GC,然后再继续观察;执行一次Run GC,然后再继续观察...。最后看看哪些对象在不断GC后,数量还一直上涨的。最后你看到的信息可能和下图类似 (图15 绿色是标记前的数量,红色是标记后的增量)
在Heap walker中分析刚才记录的对象信息 (图16) (图17)
点击上图中实例最多的class,右键**Use Selected Instances->Reference->Incoming Reference**. 发现该Long数据最终是存放在**bezier.BeaierAnim.leakMap**中。 (图18)
在Allocations tab项中,右键点击其中的某个方法,可查看到具体的源码信息. (图19)
【注】:到这里问题已经非常清楚了,明白了在图17中为什么哪些实例的数量是一样多,并且为什么内存在fullgc后还是回收不了(一个old 区的对象leakMap,put的信息也会进入old区, leakMap如回收不掉,那么该map中包含的对象也回收不掉)。
A2. 模拟线程阻塞的场景(勾选图13中Simulate blocking 模拟线程间锁的阻塞) 为了方便区分线程,我将Demo中的BezierAnim.java的L236的线程命名为test
public void start () {
thread = new Thread(this , "test" ); thread.setPriority(Thread.MIN_PRIORITY); thread.start(); }
正常情况下,如下图 (图20)
勾选了Demo中"Simulate blocking"选项后,如下图(注意看下下图中的状态图标), test线程block状态明显增加了。 (图21)
在**Monitors & locks->Monitor History**观察了一段时间后,会发现有4种发生锁的情况。
第一种: AWT-EventQueue-0 线程持有一个Object的锁,并且处于Waiting状态。
图下方的代码提示出Demo.block方法调用了object.wait方法。这个还是比较容易理解的。 (图22)
第二种: AWT-EventQueue-0占有了bezier.BezierAnim$Demo实例上的锁,而test线程等待该线程释放。
注意下图中下方的源代码, 这种锁的出现原因是Demo的blcok方法在AWT和test线程 都会被执行,并且该方法是synchronized. (图23)
第三种和第四种: test线程中会不断向事件Event Dispatching Thread提交任务,导致竞争java.awt.EventQueue对象锁。 提交任务的方式是下面的代码:repaint()
和EventQueue.invokeLater
public void run () { Thread me = Thread.currentThread(); while (thread == me) { repaint(); if (block) { block(false ); } try { Thread.sleep(10 ); } catch (Exception e) { break ; } EventQueue.invokeLater(new Runnable() { @Override public void run () { onEDTMethod(); } }); } thread = null ; }
(图24)
六. 最佳实践
JProfiler都会对一些特殊操作给予提示,这时候最好仔细阅读下说明. "Mark Current"功能在某些场景很有效 Heap walker一般是静态分析在Live memory->Recorder objects的对象信息,这些信息可能会被GC回收掉,导致Heap walker中什么也没有显示出来。这种现象是正常的。 可以才工具栏中Start Recordings配置一次性收集的信息 Filter中include和exclude是有顺序的,注意使用下图**左下方**的**“Show Filter Tree”**来验证一下顺序 (图25)
七. 参考文献
JProfiler helper: http://resources.ej-technologies.com/jprofiler/help/doc/index.html JVMTI: http://docs.oracle.com/javase/7/docs/platform/jvmti/jvmti.html