编程修炼之调试:Btrace+arthas

工具篇

Btrace

  • jps命令查出需要监控的jvm pid
  • 编写BTrace跟踪程序
  • 执行:btrace BTrace跟踪程序
    Btrace脚本就是一个普通的用@Btrace注解的Java类,其中包含一个或多个public static void修饰的方法,注意拦截方法必须是用public static void 进行修饰的,如果不是静态方法则会抛出 instance methods are not allowed 这样的异常信息 如果不是public 则会提示btrace methods should be public ;如果有返回则提示信息为:btrace probe methods must return void

为了保证对目标程序不造成影响,Btrace脚本对其可以执行的动作做了很多限制,如下:

不能创建对象
不能抛出或者捕获异常
不能用synchronized关键字
不能对目标程序中的instace或者static变量
不能调用目标程序的instance或者static方法
脚本的field、method都必须是static的
脚本不能包括outer,inner,nested class
脚本中不能有循环,不能继承任何类,任何接口与assert语句

Arthas

在线教程
arthas是阿里出品的一款非常优秀的java诊断工具。
他关注解决的问题:
这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
是否有一个全局视角来查看系统的运行状况?
有什么办法可以监控到JVM的实时运行状态?
怎么快速定位应用的热点,生成火焰图?

下载安装

curl -O https://alibaba.github.io/arthas/arthas-boot.jar
java -jar arthas-boot.jar

github:https://github.com/alibaba/arthas/blob/master/site/src/site/sphinx/quick-start.md

https://maven.aliyun.com/repository/public/com/taobao/arthas/arthas-packaging/3.x.x/arthas-packaging-3.x.x-bin.zip

从Github Releases页下载
https://github.com/alibaba/arthas/releases

使用

基础命令

help——查看命令帮助信息
cat——打印文件内容,和linux里的cat命令类似
echo–打印参数,和linux里的echo命令类似
grep——匹配查找,和linux里的grep命令类似
tee——复制标准输入到标准输出和指定的文件,和linux里的tee命令类似
pwd——返回当前的工作目录,和linux命令类似
cls——清空当前屏幕区域
session——查看当前会话的信息
reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
version——输出当前目标 Java 进程所加载的 Arthas 版本号
history——打印命令历史
quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
stop——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
keymap——Arthas快捷键列表及自定义快捷键

jvm相关

dashboard——当前系统的实时数据面板
thread——查看当前 JVM 的线程堆栈信息
jvm——查看当前 JVM 的信息
sysprop——查看和修改JVM的系统属性
sysenv——查看JVM的环境变量
vmoption——查看和修改JVM里诊断相关的option
perfcounter——查看当前 JVM 的Perf Counter信息
logger——查看和修改logger
getstatic——查看类的静态属性
ognl——执行ognl表达式
mbean——查看 Mbean 的信息
heapdump——dump java heap, 类似jmap命令的heap dump功能

class/classloader相关

sc——查看JVM已加载的类信息
sm——查看已加载类的方法信息
jad——反编译指定已加载类的源码
mc——内存编译器,内存编译.java文件为.class文件
redefine——加载外部的.class文件,redefine到JVM里
dump——dump 已加载类的 byte code 到特定目录
classloader——查看classloader的继承树,urls,类加载信息,使用classloader去getResource

monitor/watch/trace相关

请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 stop 或将增强过的类执行 reset 命令。

monitor——方法执行监控

watch——方法执行数据观测
trace——方法内部调用路径,并输出方法路径上的每个节点上耗时
stack——输出当前方法被调用的调用路径
tt——方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测

profiler/火焰图

profiler–使用async-profiler对应用采样,生成火焰图

options

options——查看或设置Arthas全局开关

管道

Arthas支持使用管道对上述命令的结果进行进一步的处理,如sm java.lang.String * | grep ‘index’
grep——搜索满足条件的结果
plaintext——将命令的结果去除ANSI颜色
wc——按行统计输出结果

后台异步任务

当线上出现偶发的问题,比如需要watch某个条件,而这个条件一天可能才会出现一次时,异步后台任务就派上用场了,详情请参考这里

使用 > 将结果重写向到日志文件,使用 & 指定命令是后台运行,session断开不影响任务执行(生命周期默认为1天)

jobs——列出所有job
kill——强制终止任务
fg——将暂停的任务拉到前台执行
bg——将暂停的任务放到后台执行

Web Console

通过websocket连接Arthas。

Web Console
以java agent方式启动
以java agent方式启动
as.sh 和 arthas-boot 技巧
通过select功能选择attach的进程。

正常情况下,每次执行as.sh/arthas-boot.jar需要选择,或者指定PID。这样会比较麻烦,因为每次启动应用,它的PID会变化。

比如,已经启动了arthas-demo.jar,使用jps命令查看:

$ jps
58883 arthas-demo.jar
58884 Jps
通过select参数可以指定进程名字,非常方便。

调试步骤

那么我们发散一下,如何调试服务器上生产故障呢?

首先,我们得先确定故障源在哪里

附:

  1. top基本使用
    top命令运行图
    在这里插入图片描述

第一行:基本信息
在这里插入图片描述

第二行:任务信息
在这里插入图片描述

第三行:CPU使用情况
在这里插入图片描述

第四行:物理内存使用情况
在这里插入图片描述

buff/cache:
buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据

在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。
cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。

第五行:交换区使用情况
在这里插入图片描述

Swap(内存交换区):
是硬盘上的一块空间。在内存不足的情况下,操作系统把内存中不用的数据存到硬盘的交换区,腾出内存来让别的程序运行。因此,开启swap会一定程度的引起 I/O 性能下降(阿里服务器默认不开)。

第六行:进程详细信息
在这里插入图片描述
此外top命令的参数:
在这里插入图片描述

在这里插入图片描述

java自带工具信息获取

得到异常的线程id号,那么我们可以用jstack将堆栈信息输出出来
jstack 22095 > loop.txt

以PID为22114的线程为例,到loop.txt中查找该线程的信息,因为jstack中PID用的是16进制,所以需要将10进制的PID转换为16进制的数值到文件中查找。

printf "%x" 22114
#输出5662

这样我们一般就能由此分析代码,当然我们也可以通过上面提供的调试工具分析。

arthas分析

在这里插入图片描述

java -jar arthas-boot.jar

vmoption修改vm参数:
在这里插入图片描述

在调试代码的过程中,查看变量值的和更新字节码这两个功能用得多一些,可以使用watch:
watch后面接的参数为:
1.被观察对象的类名
2.被观察的方法
3.方法的返回值

  1. 反编译代码

如果上面通过线程堆栈分析发现了问题代码,那么下面开始反编译代码

jad --source-only com.atai.shop.test.PoinFunction > /home/ubuntu/code/PointFuntion.java
  1. 查找加载BuryPointFilter的ClassLoader
    生成的字节码要包含原来类加载器的信息,所以要找到BuryPointFilter是由jvm中哪个classLoader加载的。使用sc(search class)命令搜索classLoader信息.
  2. 生成代码修改后的字节码
    使用mc(memory compiler)命令生成字节码
    -c 参数指定classLoader
    -d 参数指定生成后的字节码位置
sc -d *PointFunction |grep classLoaderHash
res: classLoaderHash 11ae5210
mc -c 11ae5210 /home/ubuntu/code/PointFuntion.java  -d /tmp

  1. redefine 热更新
redefine /***/PointFuntion.class 

完成

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值