Arthas
Arthas是阿里开源的诊断工具
当你遇到以下类似问题而束手无策时,Arthas
可以帮助你解决:
- 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
- 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
- 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
- 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
- 是否有一个全局视角来查看系统的运行状况?
- 有什么办法可以监控到JVM的实时运行状态?
- 怎么快速定位应用的热点,生成火焰图?
Arthas
支持JDK 6+,支持Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab
自动补全功能,进一步方便进行问题的定位和诊断。
以上介绍摘自官网,一般线上的Linux环境是没有GUI页面的,我们常用的JVisualVM MAT等工具不太好用,需要dump快照文件,而一个dump快照文件一般非常大,从生产服务器宽带有限的情况下传输给开发本地进行查看会需要很长时间,使用Arthas的命令行工具可以快速定位问题.
启动arthas
可以直接启动会监控应用所有的java进程然后选择具体需要监控哪一个进程,也可以直接带上PID监控某一个java进程(推荐)
java -jar arthas-boot.jar
java -jar arthas-boot.jar PID
启动成功如下
退出
- quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
- stop——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
基础命令
-
help——查看命令帮助信息
也可以选择某一个命令 -h 获取具体命令的帮助
-
cat——打印文件内容,和linux里的cat命令类似
-
echo–打印参数,和linux里的echo命令类似
-
grep——匹配查找,和linux里的grep命令类似
-
base64——base64编码转换,和linux里的base64命令类似
-
tee——复制标准输入到标准输出和指定的文件,和linux里的tee命令类似
-
pwd——返回当前的工作目录,和linux命令类似
-
cls——清空当前屏幕区域
-
session——查看当前会话的信息
-
reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
-
version——输出当前目标 Java 进程所加载的 Arthas 版本号
-
history——打印命令历史
-
quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
-
stop——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
-
keymap——Arthas快捷键列表及自定义快捷键
JVM相关命令
-
dashboard——当前系统的实时数据面板
-i 采样间隔时间单位ms 默认5000ms
-n 采样几次
dashboard反馈了java进程的整体信息包括了线程相关信息 堆栈使用情况 和运行时数据信息 总览整个java进程
-
thread——查看当前 JVM 的线程堆栈信息
-n number 查看cpu占用率较高的number个线程并打印堆栈信息
-b 找到程序中阻塞的线程
-i 采样间隔单位ms 默认200ms
可以看到写了一个死锁的程序Thread0和Thread1是block的状态
-
JVM 查看当前JVM信息 包含了RUNTIME的基础信息 GC的信息 内存使用信息 线程统计信息
-
sysprop——查看和修改JVM的系统属性 sysenv——查看JVM的环境变量 类似jinfo -sysprops 和jps -v
sysprop 和 sysenv 都可以添加 name 参数查看都一个属性的值 如 sysprop java.vm.info
-
heapdump 导出java进程的堆栈快照类似 jmap dump
heapdump 导出到临时目录
heapdump /tmp/path/dump.hprof
–live 只导出存活对象
class和classloader相关
-
sc——查看JVM已加载的类信息 search class
查看某一个类是否被加载 -d参数显示详细信息
-
sm——查看已加载类的方法信息 search method -d显示详细信息
sm -d ClassName 列出该类的所有方法
sm -d ClassName MethodName 列出该类的某一个方法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PrcdPZFb-1614844880481)(https://gitee.com/jianimaoju/image-storage-service/raw/master/image/202103/01/164841-802770.png)]
-
jad——反编译指定已加载类的源码
jad ClassName 反编译一个类
jad ClassName MethodName 反编译某一个方法
-
mc——内存编译器,内存编译
.java
文件为.class
文件 一般配合retransform或redefine使用 -
retransform——加载外部的
.class
文件,retransform到JVM里 -
redefine——加载外部的
.class
文件,redefine到JVM里 -
dump——dump 已加载类的 byte code 到特定目录
-
classloader——查看classloader的继承树,urls,类加载信息,使用classloader去getResource
monitor/watch/trace 方法追中相关
请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 stop
或将增强过的类执行 reset
命令。
-
monitor——方法执行监控
返回时间戳 类名 方法名 执行次数 成功次数 失败次数 平均运行时间 失败率
-
watch——方法执行数据观测
watch class-pattern method-parttern express condition-express 配合使用OGNL表达式来完成方法相关的监控
-b 方法调用之前观察
-e 方法异常之后观察
-s 方法返回之后观察
-f 方法结束之后观察(正常退出后和异常退出)
-n 采样几次
-x 表示遍历深度,根据不同的深度来打印参数的内容 默认是1
观察方法出参和返回值 watch monitor.WatchTest testWatch “{params,returnObj}”
观察方法调用前后的参数和返回值 watch monitor.WatchTest testWatch “{params,returnObj}” -b -s -e
这里要注意
方法入参
和方法出参
的区别,有可能在中间被修改导致前后不一致,除了-b
事件点params
代表方法入参外,其余事件都代表方法出参条件表达式 watch monitor.WatchTest testWatch “{params[0],returnObj}” “params[0]>500” -n3 只有当索引为0的参数大于500才监控
根据耗时过滤 watch monitor.WatchTest testWatch “{params,returnObj}” “#cost>1000” -n3