一、背景
某日晚,需要协助女朋友排查一个线上问题,其请求调用比较复杂,单次请求过来会多次通过不同路径调用存在问题的方法,并且还有很多重载的方法,排查过程中需要结合stack和各种条件判断,极其麻烦;期间也遇到了 Arthas中使用watch观测方法执行前后,基本类型参数的值不一致的问题。
此问题的结论和原因虽然都比较简单,但其排查过程也可供学习记录。
只想看结论的同学也可以直接看 第四点 !
1.代码
由于真实情况涉及公司业务,而且有很多无关紧要的逻辑,所以写了个超级简化版。
package com.company;
import java.util.concurrent.ConcurrentHashMap;
public class TmpTest {
public static void main(String[] args) throws InterruptedException {
for (int i = 0; i < 1000; i++) {
//睡眠10s,一是避免程序退出,二是可以持续观测
Thread.sleep(10*1000);
//这里使用了两个请求意在贴近实际场景,使用Arthas时,能够筛选出自己想要观测的请求是一个非常重要的能力
//第一个请求进入,该请求是我们想要观测的请求,该flow1是固定或者可控的
int flow1 = 1234;
new Thread(new Runnable() {
@Override
public void run() {
runRequest(flow1);
}
}).start();
//第二个请求进入,该请求是其他用户发起的请求,是干扰项
int flow2 = 6789;
new Thread(new Runnable() {
@Override
public void run() {
runRequest(flow2);
}
}).start();
}
}
/**
* 假设该方法为请求的处理方法
*/
private static void runRequest(int flow){
//设置流水
setFlow(flow);
//判断是否支持 https
boolean supportHttps = condition1() && condition2() == 2 && "https".equals(condition3());
//获取前缀,getPrefix的参数是我们的观测目标,看它是true还是false
String prefix = getPrefix(supportHttps);
//输出前缀
System.out.println(prefix);
}
private static String getPrefix(boolean supportHttps) {
supportHttps = subCondition();
return supportHttps ? "https" : "http";
}
private s