CyclicBarrier用法注意
背景
最近,接运维报,生产环境某个Java应用内存一直缓慢增长。
分析
我们JVM堆内存配置最大和最小是一样,不可能增长;只可能是非堆内存增长。
非堆内存包括类数据、线程、JIT编译的代码、GC数据、常量池、Internal、Compiler等等。
具体参考NMT Memory Categories
通过Spring Boot Admin查看应用详情,发现应用的线程数有异常,是正常情况的2倍多。
通过jstack输出线程信息,找到数量异常的线程,然后通过查看代码,发现下面这段逻辑(模拟代码,去掉了具体业务)会导致线程一直阻塞。
public static void barrier(){
CyclicBarrier cb = new CyclicBarrier(3);
Thread t1 = new Thread(){
@Override
public void run() {
try{
cb.await(60, TimeUnit.SECONDS);
}catch(Exception e){
e.printStackTrace();
}finally {
System.out.println(Thread.currentThread().getName() + " finally");
try {
cb.await();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (BrokenBarrierException e) {
e.printStackTrace();
}
}
System.out.println(Thread.currentThread().getName() + " stop");
}
};
Thread t2 = new Thread(){
@Override
public void run() {
try{
cb.await(60, TimeUnit.SECONDS);
}catch (Exception e){
try {
cb.await();
} catch (InterruptedException e1) {
e1.printStackTrace();
} catch (BrokenBarrierException e1) {
e1.printStackTrace();
}
}
System.out.println(Thread.currentThread().getName() + " stop");
}
};
t1.start();
t2.start();
try {
cb.await(65, TimeUnit.SECONDS);
} catch (InterruptedException e) {
e.printStackTrace();
} catch (BrokenBarrierException e) {
e.printStackTrace();
} catch (TimeoutException e) {
e.printStackTrace();
}
System.out.println(Thread.currentThread().getName() + " stop");
}
原因
CyclicBarrier,可循环使用的栅栏。初始化时指定一个数量,每个线程执行完后调用下await,线程阻塞,数量减1;当数量减到0时,前面阻塞的线程全部唤醒,同时栅栏重置,可重新使用。
CyclicBarrier主要用于多线程并发执行子任务,最后统一汇总结果的场景。
上面的代码出现问题,主要原因是栅栏数量是3,代码却有4次await,第3次await就会唤醒线程,同时栅栏重置。第4次await的线程就会一直阻塞,因为新栅栏数量也是3,需要3次await才能唤醒线程。
结论
我们不熟悉CyclicBarrier的实现机制导致上面问题。对于不熟悉的代码,最好看一下它的实现原理,最不济也要进行一下测试。
对于上面的逻辑,可以使用CountDownLatch,不容易出错。