JVM监控及诊断工具GUI-Arthas

一、Arthas概述

官网入口

Arthas 是 Alibaba 开源的 Java 诊断工具

Arthas 是一款线上监控诊断产品
在不修改代码以及添加额外监听配置的情况下对应用进行监控、诊断以及对方法的调用进行监控。

1. 背景

以往线上遇到问题有以下几种方案

  • 在测试环境复现,有些问题复现困难
  • IDE 远程调试。更糟糕的是,在生产环境中调试是不可接受的,因为它会暂停所有线程,导致服务暂停。
  • 添加打印日志以帮助解决问题,添加日志-发布-然后通过日志定位问题-处理问题-验证,是不是很繁琐、很窝火。。。

Arthas 旨在解决这些问题。开发人员可以在线解决生产问题。无需 JVM 重启,无需代码更改。Arthas 作为观察者永远不会暂停正在运行的线程

2. Arthas(阿尔萨斯)能为你做什么?

当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:

  • 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  • 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  • 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  • 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  • 是否有一个全局视角来查看系统的运行状况?
  • 有什么办法可以监控到 JVM 的实时运行状态?
  • 怎么快速定位应用的热点,生成火焰图?
  • 怎样直接从 JVM 内查找某个类的实例?
    Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。

二、Arthas的入门

1. Arthas的安装

这里介绍官网推荐的安装方式,其他方式安装直接参考官网

使用arthas-boot

curl -O https://arthas.aliyun.com/arthas-boot.jar

2. Arthas的使用

  • Arthas的启动
方式1
1. jps打印需监控的应用PID
2. java -jar arthas-boot.jar PID

方式2
1. java -jar arthas-boot.jar 
然后Arthas会列举jps相关的应用进程
2. 然后输入 [序号]中的序号,切记是序号,不是进程号

中文乱码处理: java -Dfile.encoding=UTF-8 -jar arthas-boot.jar


然后就进入了与Arthas的交互模式

采用浏览器访问也可以与Arthas进行交互,端口是固定的

Arthas 目前支持 Web Console,用户在 attach 成功之后,
可以直接访问:http://127.0.0.1:8563/。

可以填入 IP,远程连接其它机器上的 arthas。
  • Arthas的退出
    • 如果只是退出当前的连接,可以用quit或者exit命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。其他连接的客户端不受影响, 下次直接使用 java -jar arthas-boot.jar PID可重新建立连接,假如PID不是原有的PID,就会提示端口已占用
    • 如果想完全退出 arthas,可以执行stop命令。退出Arthas服务端,退出所有的客户端
  • Arthas查看帮助信息
java -jar arthas-boot.jar -h

三、常见命令解释

1. JVM相关

  • dashboard - 当前系统的实时数据面板
// 刷新实时数据的时间间隔 (ms),默认 5000ms
dashboard -i 5000
// 刷新实时数据的次数
dashboard -n 1

  • jvm - 查看当前 JVM 的信息
$ jvm
RUNTIME
--------------------------------------------------------------------------------------------------------------
 MACHINE-NAME                   37@ff267334bb65
 JVM-START-TIME                 2020-07-23 07:50:36
 MANAGEMENT-SPEC-VERSION        1.2
 SPEC-NAME                      Java Virtual Machine Specification
 SPEC-VENDOR                    Oracle Corporation
 SPEC-VERSION                   1.8
 VM-NAME                        Java HotSpot(TM) 64-Bit Server VM
 VM-VENDOR                      Oracle Corporation
 VM-VERSION                     25.201-b09
 INPUT-ARGUMENTS                []
 CLASS-PATH                     demo-arthas-spring-boot.jar
 BOOT-CLASS-PATH                /usr/lib/jvm/java-8-oracle/jre/lib/resources.jar:/usr/lib/jvm/java-8-oracle/j
                                re/lib/rt.jar:/usr/lib/jvm/java-8-oracle/jre/lib/sunrsasign.jar:/usr/lib/jvm/
                                java-8-oracle/jre/lib/jsse.jar:/usr/lib/jvm/java-8-oracle/jre/lib/jce.jar:/us
                                r/lib/jvm/java-8-oracle/jre/lib/charsets.jar:/usr/lib/jvm/java-8-oracle/jre/l
                                ib/jfr.jar:/usr/lib/jvm/java-8-oracle/jre/classes
 LIBRARY-PATH                   /usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib

--------------------------------------------------------------------------------------------------------------
 CLASS-LOADING
--------------------------------------------------------------------------------------------------------------
 LOADED-CLASS-COUNT             7529
 TOTAL-LOADED-CLASS-COUNT       7529
 UNLOADED-CLASS-COUNT           0
 IS-VERBOSE                     false

--------------------------------------------------------------------------------------------------------------
 COMPILATION
--------------------------------------------------------------------------------------------------------------
 NAME                           HotSpot 64-Bit Tiered Compilers
 TOTAL-COMPILE-TIME             14921(ms)

--------------------------------------------------------------------------------------------------------------
 GARBAGE-COLLECTORS
--------------------------------------------------------------------------------------------------------------
 PS Scavenge                            name : PS Scavenge
 [count/time (ms)]                      collectionCount : 7
                                        collectionTime : 68

 PS MarkSweep                           name : PS MarkSweep
 [count/time (ms)]                      collectionCount : 1
                                        collectionTime : 47

--------------------------------------------------------------------------------------------------------------
 MEMORY-MANAGERS
--------------------------------------------------------------------------------------------------------------
 CodeCacheManager               Code Cache

 Metaspace Manager              Metaspace
                                Compressed Class Space

 Copy                           Eden Space
                                Survivor Space

 MarkSweepCompact               Eden Space
                                Survivor Space
                                Tenured Gen


--------------------------------------------------------------------------------------------------------------
 MEMORY
--------------------------------------------------------------------------------------------------------------
 HEAP-MEMORY-USAGE                      init : 268435456(256.0 MiB)
 [memory in bytes]                      used : 18039504(17.2 MiB)
                                        committed : 181403648(173.0 MiB)
                                        max : 3817865216(3.6 GiB)

 NO-HEAP-MEMORY-USAGE                   init : 2555904(2.4 MiB)
 [memory in bytes]                      used : 33926216(32.4 MiB)
                                        committed : 35176448(33.5 MiB)
                                        max : -1(-1 B)

--------------------------------------------------------------------------------------------------------------
 OPERATING-SYSTEM
--------------------------------------------------------------------------------------------------------------
 OS                             Linux
 ARCH                           amd64
 PROCESSORS-COUNT               3
 LOAD-AVERAGE                   29.53
 VERSION                        4.15.0-52-generic

--------------------------------------------------------------------------------------------------------------
 THREAD
--------------------------------------------------------------------------------------------------------------
 COUNT                          30
 DAEMON-COUNT                   24
 PEAK-COUNT                     31
 STARTED-COUNT                  36
 DEADLOCK-COUNT                 0

--------------------------------------------------------------------------------------------------------------
 FILE-DESCRIPTOR
--------------------------------------------------------------------------------------------------------------
 MAX-FILE-DESCRIPTOR-COUNT      1048576
 OPEN-FILE-DESCRIPTOR-COUNT     100
Affect(row-cnt:0) cost in 88 ms.

  • thread - 查看当前 JVM 的线程堆栈信息
    thread功能很实用,定位CPU耗时、线程死锁等
// 查看线程情况
thread

// 当前最忙的前 3 个线程并打印堆栈
thread -n 3

// 查看86线程详情
thread 86

// 查看阻塞线程
thread -b

2. class/classloader 相关

  • jad 反编译指定已加载类的源码(可以用于查看自己的修改的代码有没有生效)
jad com.xmc.hello.controller.ArthasTestController sayHello

  • retransform 加载外部的.class文件,retransform 到 JVM 里,一般搭配mc命令使用
mc E:/ideaworkspaces/myself-ideaworkspaces/spring-boot-test/spring-boot-hello-world/src/main/java/com/xmc/hello/controller/ArthasTestController.java


retransform E:/ideaworkspaces/myself-ideaworkspaces/spring-boot-test/com/xmc/hello/controller/ArthasTestController.class E:/ideaworkspaces/myself-ideaworkspaces/spring-boot-test/com/xmc/hello/controller/ArthasTestController$1.class E:/ideaworkspaces/myself-ideaworkspaces/spring-boot-test/com/xmc/hello/controller/ArthasTestController$2.class

基于Attach机制实现的热更新,更新类需要与原来的类在包名,类名,修饰符上完全一致,否则在classRedefine过程中会产生classname don't match 的异常。

例如显示这样的报错:redefineClasses exception class redefinition failed: attempted to delete a method.

具体来说,JVM热更新局限总结:

- 方法的签名不能修改
- 不能增加类的方法或属性
- 函数必须能够退出,如果有函数在死循环中,无法执行更新类

3. monitor/watch/trace 相关

特别注意

请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中
插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明
确需要观测的类、方法以及条件,诊断结束要执行 stop 
或将增强过的类执行 reset 命令。
  • monitor - 方法执行监控
// 统计周期,默认值为 120 秒  下面是每5秒统计一次
monitor -c 5  com.xmc.hello.controller.ArthasTestController sayHello

  • trace - 方法内部调用路径,并输出方法路径上的每个节点上耗时
trace com.xmc.hello.controller.ArthasTestController trace

#95 行调用了UserService中的add方法
#96 行调用了UserService中的concat方法

  • watch - 方法执行数据观测
// 检测内部属性
 watch  com.xmc.hello.controller.ArthasTestController sayHello -x 2

-x表示遍历深度,可以调整来打印具体的参数和结果内容,默认值是 1。
-x最大值是 4,防止展开结果占用太多内存。用户可以在ognl表达式里指定更具体的 field。
{params-入参,target-当前类实例,returnObj-返回值}

// 查看具体入参属性值

 watch  com.xmc.hello.controller.ArthasTestController watch "{params[0].name}"

// 查看具体返回值属性值
watch  com.xmc.hello.controller.ArthasTestController watch "{returnObj.name}"

// 使用 -v 参数打印更多信息
当命令执行之后,没有输出结果。有两种可能:

- 匹配到的函数没有被执行
- 条件表达式结果是 false
但用户区分不出是哪种情况。

使用 -v选项,则会打印Condition express的具体值和执行结果,方便确认。

四、异常排查

使用过程中建议首先通过github issue解决
https://github.com/alibaba/arthas/issues

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Arthas(阿尔萨斯)是阿里巴巴开源的Java诊断工具,深受开发者喜爱。 当你遇到以下类似问题而束手无策时,Arthas 可以帮助你解决: 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception? 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了? 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗? 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现! 是否有一个全局视角来查看系统的运行状况? 有什么办法可以监控JVM的实时运行状态? 怎么快速定位应用的热点,生成火焰图? Arthas支持JDK 6+,支持Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的Tab自动补全功能,进一步方便进行问题的定位和诊断。   Arthas开源的Java诊断工具 更新日志: v3.5.1 Add vmtool command Remove the useless resetClassFileTransformer in Enhancer 对于非chunk response,返回标准的content-length字段 The jvm command may throw exception: java.lang.NullPointerException jad的一个小小的显示问题 bug remove env JAVA_TOOL_OPTIONS 去掉默认配置项 arthas.enhanceLoaders=java.lang.ClassLoader ,避免attach后导致系统负载飙升 Thread -n -1 不能正常工作 bug 当找不到java进程时,提示不清晰,应该提示用户执行jps命令 增加一个 ognl 的在线,可编辑的示例,帮助用户自己调试 ognl表达式 当Object输出时,可能会抛出异常,打印 ERROR DATA!!! exception message: null 把 arthas-demo 改名为 math-game ,避免新用户感到疑惑 arthas spring boot starter启动失败后,没有打印具体出错端口
Arthas是一个非常方便的Java应用性能诊断工具,可以帮助我们监控和分析JVM线程。 Arthas通过所谓的"剖析"对JVM线程进行监控。"剖析"是指在运行时对目标应用程序进行代码注入和操作,从而获取应用程序的运行信息。Arthas使用了Java的Instrumentation API,以字节码增强的方式,动态修改目标类的代码,使之能够收集和输出线程相关的信息。 使用Arthas监控JVM线程非常简单。首先,我们需要在目标Java应用程序的启动命令行中加入Arthas的Agent参数,例如: java -jar arthas-boot.jar 然后,我们可以使用命令"thread"来监控JVM线程。例如,我们可以使用"thread"命令来查看当前所有线程的堆栈信息,包括线程ID、线程名称、线程状态以及调用栈信息。 另外,Arthas还提供了一些其他的命令来更细粒度地监控线程。比如:"thread -n 5"可以指定仅显示前5个线程的堆栈信息,"thread -t 1"可以指定只显示处于RUNNABLE状态的线程。 此外,Arthas还提供了丰富的过滤条件,用于更准确地筛选要监控的线程。比如,我们可以使用"thread -n 5 -p xxx"来查看线程名称中含有"xxx"的前5个线程的信息。 总而言之,通过Arthas,我们可以方便地监控JVM线程,了解线程的状态和调用栈信息,帮助我们进行应用程序的性能分析和故障排查。使用Arthas,我们可以及时发现线程问题,并采取相应的措施来优化我们的Java应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值