良心公众号
关注不迷路
01
背景
作为程序员而言,经常需要定位各种各样的问题,解决此起彼伏的 bug。对于本地开发过程中遇到的问题,我们可以通过 IDE,再结合一些插件进行 debug,通常能够比较方便地定位问题的根源。
但有些问题,偏偏只在线上出现!本地或者测试环境很难复现!这时候,如果不能准确定位问题,通常会根据问题的现象,先锁定一个大概的范围,然后通过在程序中添加日志,获得更多的信息,从而进一步定位问题。
但这种方式,不可避免地需要重新上线部署,而且不一定能一次成功,效率往往不高。要知道,解决线上问题的第一要义就是要快,要争分夺秒,每耽误一秒,企业都可能面临巨额的损失和高额的风险。而本文的主角 —— Arthas
(阿尔萨斯) 就能做到快速定位问题,甚至不需要上线部署就能解决问题!
接下来,让我们一起看看它的真面目吧。
02
简介
Arthas
是 Alibaba 开源的 Java 诊断工具。它基于 java Agent
方式,利用 Java 的 Instrumentation
特性,以及 ASM 字节码进行 Java 应用诊断。
Arthas 的功能十分强大,它可以搞定以下问题(搬运自 Arthas 官方文档):
这个类从哪个 jar 包加载的?为什么会上报各种类相关的 Exception?
我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
是否有一个全局视角来查看系统的运行状况?
有什么办法可以监控到 JVM 的实时运行状态?
怎么快速定位应用的热点,生成火焰图?
它支持 JDK6+,支持 Linux / Mac / Windows,可以通过如下命令一键安装:
curl -L https://arthas.aliyun.com/install.sh | sh
安装之后,上述命令会下载启动脚本文件 as.sh
到当前目录,可以在shell下面执行 ./as.sh
即可进入 Arthas 交互界面。
03
常用命令
在 Arthas 交互界面选择对应的进程之后,即可对选定的进程进行一系列的操作,以解决之前提及的问题。具体涉及的操作如下所示:
通过 dashboard 命令可以查看当前进程的信息:
然后通过 thread 命令加线程号 (上图中的 ID 列) 可以查看对应线程的信息:
另外,通过 jad 加对应的类名 (包含路径在内的全限定名) 可以直接反编译对应的类,这样就可以轻松判断线上运行的代码是否符合预期。
这些功能只是开胃菜。还有更实用的功能:强大的 watch 和 trace 功能。
首先来看 watch,watch 的主要功能查看特定方法的入参和返回值,常用命令如下:
watch className methodName "{params,returnObj}" -x 2
其中,命令最后的数字代表入参和返回值展开到第几层。这样就可以在线上直接查看当前的参数和返回值,四舍五入就等于在本地 debug!
接下来再看一下 trace,trace 的主要功能是跟踪方法内部调用路径,并输出方法路径上的每个节点上耗时,常用命令如下:
trace className methodName
使用 trace 命令,不仅可以查看方法的调用链中的异常,还可以通过结点耗时来排查性能问题,着实十分方便。
Arthas 还支持查看当前 JVM 的信息,通过简单的 jvm 命令就可以做到,部分内容截图如下所示:
通过这部分信息,我们可以有针对性地进行 JVM 调优,当然,单纯查看 JVM 信息并不一定需要使用 Arthas。
另外,值得一提的是,Arthas 还可以生成应用热点的火焰图。使用 profiler 命令,通过不断的采样,将收集到的采样结果生成火焰图。我们可以通过 profiler list命令来查看火焰图支持采样的事件:
另外,Arthas 还支持方法执行监控,编码等功能,由于对本文关注的问题排查关系不大,在此就不展开,感兴趣可以移步 Arthas 官方文档进行查看。
欢迎关注【有理想的菜鸡】公众号,大家一起讨论技术,共同成长!
学习 | 工作 | 分享
????长按关注“有理想的菜鸡”
只有你想不到,没有你学不到