导读:生产环境线上定位BUG时通常是通过分析日志里打印出来的异常堆栈信息,但有时候还是找出不出具体原因则需要结合观察出入参和变量等值进行排查。但是要线上加打印日志分析意味着需要停止服务并加上日志后重启,这样操作不怎么方便。这里给大家安利Alibaba开源的Java诊断工具-Arthas。
一、Arthas有助于解决:
- 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
- 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
- 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
- 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
- 是否有一个全局视角来查看系统的运行状况?
- 有什么办法可以监控到JVM的实时运行状态?
二、安装和运行
- 官网给出了一个Demo项目和详细安装方式及教程。
官方文档地址:https://alibaba.github.io/arthas/index.html
- 先启动Demo项目,再启动Arthas并指定要进行诊断的Java进程。
三、诊断的例子
场景1:当自己修改了代码之后发上生产发现没有修改效果。可以通过反编译指定已加载类取得源码后用于排查自己修改的代码为什么不生效,是否有commit到版本中
$ jad demo.MathGame
场景2:当查看日志异常栈对找不出问题时,需要结合出入参、变量等值进行配合排查。通过停止服务插入日志代码并重启的方式比较繁琐且不太妥当。可以通过watch命令解决。
- watch命令的参数
- watch 命令定义了4个观察事件点,即 -b 方法调用前,-e 方法异常后,-s 方法返回后,-f 方法结束后
- 4个观察事件点 -b、-e、-s 默认关闭,-f 默认打开,当指定观察点被打开后,在相应事件点会对观察表达式进行求值并输出
- 观察表达式构成主要由 ognl 表达式组成,。
例1:查看观察方法出参和返回值
$ watch demo.MathGame primeFactors "{params,returnObj}"
例2:观察在方法异常之后情况下的参数
$ watch demo.MathGame primeFactors "{params[0],throwExp}" -e
四、总结
Arthas提供了丰富的命令用于诊断,也支持诊断Docker里的Java进程和K8S里容器里的Java进程。线上遇到问题的时候Arthas也是一种不错的诊断方式。
感谢您的阅读,如果喜欢本文欢迎关注和转发,本头条号将持续分享IT技术知识。对于文章内容有其他想法或意见建议等,欢迎提出共同讨论共同进步。