项目场景:
为了优化代码的执行速度,在代码中使用了CountDownLatch对执行方法进行多线程处理,并等待线程全部结束后释放线程并继续执行主线程的操作。使用了CountDownLatch和Thread的组合,确实让接口的耗时降低了许多。但是也为我这次遇到的bug埋下了隐患。
回顾一下CountDownLatch的概念:允许一个或者多个线程去等待其他线程完成操作。构造函数允许接收一个int值,作为初始线程数量,也可以认为是倒数几个数。
线程执行完毕后,通过 countDown() 方法,对构造中的count值进行-1操作,等到count值是0后,CountDownLatch才会释放所有线程的等待。
还有 await() 方法,用这个方法让全部的线程进入等待。
这两个方法就是 CountDownLatch 的关键方法。
问题描述
这次遇到的问题表象是接口超时,而且会比一般超时接口还要时间久,一般如果在接口中访问外部接口超时了,超过了Http设置的等待时间,那么还是会被catch 捕获,最终提示出来接口超时的。但是这一次不同,经过长时间的等待后,这个接口却提示 504 Nginx Time out。那么基本上就可以确定这个是我们程序内部的异常了。
幸亏问题出在测试环境,拿到参数后在本地执行,在执行到CountDownLatch的await() 方法后,程序好像挂起了,开始不执行了,第一反应是不是有线程死锁了啊,然后通过jconsole和jvisualvm都看了下,并没有出现死锁。
首先看下问题代码。
List<OrderInfo> orderInfos = new ArrayList<>();
final CountDownLatch latch = new CountDownLatch(collect.size());
for