等待多线程完成的CountDownLatch
CountDownLatch允许一个或多个线程等待其他线程完成操作。
假如有这样一个需求:我们需要解析一个Excel里多个sheet的数据,此时可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完之后,程序需要提示解析完成。在这个需求中,要实现主线程等待所有线程完成sheet的解析操作,最简单的做法是使用join()方法,如下:
public class JoinCountyDownLatchTest{
public static void main(String[] args) throws InterruptedException{
Thread parser1 = new Thread(new Runnable(){
public void run(){
}
});
Thread parser2 = new Thread(new Runnable(){
public void run(){
}
});
parser1.start();
parser2.start();
parser1.join();
parser2.join();
System.out.println("all parser finish");
}
}
join用于让当前执行线程等待join线程执行结束。其实现原理是不停检查join线程是否存活,如果join线程存活则让当前线程永远等待。其中,wait(0)表示永远等待下去,代码片段如下:
while(isAlive()){
wait(0);
}
直到join线程中止后,线程的this.notifyAll()方法会被调用,调用notifyAll()方法是在JVM里实现的,所以在JDK里看不到。
在JDK 1.5之后的并发包中提供的CountDownLatch也可以实现join的功能,并且比join的功能更多:
public class CountDownLatchTest{
static CountDownLatch c = new CountDownLatch(2);
public static void main(String[] args) throws InterruptedException{
new Thread(new Runnable(){
public void run(){
System.out.println(1);
c.countDown();
System.out.println(2);
c.countDown();
}
}).start();
c.await();
System.out.println(3);
}
}
CountDownLatch的构造函数接收一个int类型的参数作为计数器,如果你想等待N个点完成,这里就传入N。
当我们调用CountDownLatch的countDown方法时,N就会减1,CountDownLatch的await方法会阻塞当前线程,直到N变成零。由于countDown方法可以用在任何地方,所以这里说的N个点,可以是N个线程,也可以是1个线程里的N个执行步骤。用在多个线程时,只需要把这个CountDownLatch的引用传递到线程里即可。
如果有某个解析sheet的线程处理得比较慢,我们不可能让主线程一直等待,所以可以使用另外一个带指定时间的await方法——await(long time,TimeUnit unit),这个方法等待特定时间后,就会不再阻塞当前线程。join也有类似的方法。
计数器必须大于等于0,只是等于0时候,计数器就是零,调用await方法时不会
阻塞当前线程。CountDownLatch不可能重新初始化或者修改CountDownLatch对象的内部计数器的值。一个线程调用countDown方法happen-before,另外一个线程调用await方法。
同步屏障CylicBarrier
CyclicBarrier的字面意思是可循环使用(Cyclic)的屏障(Barrier)。它要做的事情是,让一组线程到达一个屏障(也可以叫同步点)时被阻塞,直到最后一个线程到达屏障时,屏障才会开门,所有被屏障拦截的线程才会继续运行。
CyclicBarrier简介
CyclicBarrier默认的构造方法是CyclicBarrier(int parties),其参数表示屏障拦截的线程数量,每个线程调用await方法告诉CyclicBarrier我已经到达了屏障,然后当前线程被阻塞。
public class cyclicBarrierTest{
static CyclicBarrier c = new CyclicBarrier(2);
public static void main(String[] args){
new Thread(new Runnable(){
public void run(){
try{
w.await();
}catch(Exception e){
}
System.out.println(1);
}
}).start();
try{
c.await();
}catch(Exception e){
}
System.out.println(2);
}
}
因为主线程和子线程的调度是由CPU决定的,两个线程都有可能先执行,所以会产生两种输出。
如果把new CyclicBarrier(2)修改成new CyclicBarrier(3),则主线程和子线程会永远等待,因为没有第三个线程执行await方法,即没有第三个线程到达屏障,所以之前到达屏障的两个线程都不会继续执行。
CyclicBarrier还提供一个更高级的构造函数CyclicBarrier(int parties,Runnable barrierAction),用于在线程到达屏障时,优先执行barrierAction,方便处理更复杂的业务场景。
public class CyclicBarrierTest2{
static CyclicBarrier c = new CyclicBarrier(2,new A());
public static void main(String[] args){
new Thread(new Runnable(){
public void run(){
try{
c.await();
}catch(Exception e){
}
System.out.println(1);
}
}).start();
try{
c.await();
}catch(Exception e){
}
System.out.println(2);
}
static class A implements Runnable{
public void run(){
System.out.println(3);
}
}
}
因为CyclicBarrier设置了拦截线程的数量是2,所以必须等代码中的第一个线程和线程A都执行完之后,才会继续执行主线程,然后输出2。输出顺序是:3 1 2.
CyclicBarrier的应用场景
CyclicBarrier可以用于多线程计算数据,最后合并计算结果的场景。例如,用一个Excel保存了用户所有银行流水,每个Sheet保存一个账户近一年的每笔银行流水,现在需要统计用户的日均银行流水,先用多线程处理每个sheet里的银行流水,都执行完之后,得到每个sheet的日均银行流水,最后,再用barrierAction用这些线程的计算结果,计算出整个Excel的日均银行流水,如代码:
public class BankWaterService implements Runnable{
//创建4个屏障,处理完之后执行当前类的run方法
private CyclicBarrier c = new CyclicBarrier(4,this);
//假设只有4个sheet,所以只启动4个线程
private Executor executor = Executors.newFixedThreadPool(4);
//保存每个sheet计算出的银流结果
private ConcurrentHashMap<String,Integer> sheetBankWaterCount = new ConcurrentHashMap<String,Integer>();
private void count(){
for(int i = 0;i<4;i++){
executor.execute(new Runnable(){
public void run(){
//计算当前sheet的银流数据,计算省略
sheetBankWaterCount.put(Thread.currentThread().getName(),1);
//银流计算完成,插入一个屏障
try{
c.await();
}catch(InterruptedException e){
}
}
});
}
}
public void run(){
intresult = 0;
//汇总每个sheet计算出的结果
for(Entry<String,Integer> sheet : sheetBankWaterCount.entrySet()){
result += sheet.getValue();
}
sheetBankWaterCount.put("result",result);
System.out.println(result);
}
public static void main(String[] args){
BankWaterService bankWaterCount = new BankWaterService();
bankWaterCount.count();
}
}
使用线程池创建4个线程,分别计算每个sheet里的数据,每个sheet计算结果是1,再由BankWaterService线程汇总4个sheet计算出的结果。
CyclicBarrier和CountDownLatch的区别
CountDownLatch的计数器只能使用一次,而CyclicBarrier的计数器可以使用reset()方法重置。所以CyclicBarrier能处理更为复杂的业务场景。例如,如果计算发生错误,可以重置计数器,并让线程重新执行一次。
CyclicBarrier还提供其他有用的方法,比如getNumberWaiting方法可以获得Cyclic-Barrier阻塞的线程数量。isBroken()方法用来了解阻塞的线程是否被中断。
public class CyclicBarrierTest3{
static CyclicBarrier c = new CyclicBarrier(2);
public static void main(String[] args) throws InterruptedException{
Thread thread = new Thread(new Runnable(){
public void run(){
try{
c.await();
}catch(Exception e){
}
}
});
thread.start();
thread.interrupt();
try{
c.await();
}catch(Exception e){
System.out.println(c.isBroken());
}
}
}
控制并发线程数的Semaphore
Semaphore(信号量)是用来控制同时访问特定资源的线程数量,它通过协调各个线程,以保证合理的使用公共资源。
1.应用场景
Semaphore可以用于做流量控制,特别是公用资源有限的应用场景,比如数据库连接。假如有一个需求,要读取几万个文件的数据,因为都是IO密集型任务,我们可以启动几十个线程并发地读取,但是如果读到内存后,还需要存储到数据库中,而数据库的连接数只有10个,这时我们必须控制只有10个线程同时获取数据库连接保存数据,否则会报错无法获取数据库连接。这个时候,就可以使用Semaphore来做流量控制。
public class SemaphoreTest{
private static final int THREAD_COUNT = 30;
private static ExecutorServicethreadPool = Excutors.newFixedThreadPool(THREAD_COUNT);
private static Semaphore s = new Semaphore(10);
for(int i =0;i<THRED_COUNT;i++){
threadPool.execute(new Runnable(){
public void run(){
try{
s.acquire();
System.out.println("save data");
s.release();
}catch(){
}
}
});
}
threadPool.shutdown();
}
虽然有30个线程在执行,但是只允许10个并发执行。Semaphore的构造方法
Semaphore(int permits)接受一个整型的数字,表示可用的许可证数量。Semaphore(10)表示允许10个线程获取许可证,也就是最大并发数是10。Semaphore的用法也很简单,首先线程使用Semaphore的acquire()方法获取一个许可证,使用完之后调用release()方法归还许可证。还可以用tryAcquire()方法尝试获取许可证。
2.其他方法
·intavailablePermits():返回此信号量中当前可用的许可证数。
·intgetQueueLength():返回正在等待获取许可证的线程数。
·booleanhasQueuedThreads():是否有线程正在等待获取许可证。
·void reducePermits(int reduction):减少reduction个许可证,是个protected方法。
·Collection getQueuedThreads():返回所有等待获取许可证的线程集合,是个protected方法。
线程间交换数据的Exchanger
Exchanger(交换者)是一个用于线程间协作的工具类。Exchanger用于进行线程间的数据交换。它提供一个同步点,在这个同步点,两个线程可以交换彼此的数据。这两个线程通过exchange方法交换数据,如果第一个线程先执行exchange()方法,它会一直等待第二个线程也执行exchange方法,当两个线程都到达同步点时,这两个线程就可以交换数据,将本线程生产出来的数据传递给对方。
Exchanger可以用于遗传算法,遗传算法里需要选出两个人作为交配对象,这时候会交换两人的数据,并使用交叉规则得出2个交配结果。Exchanger也可以用于校对工作,比如我们需要将纸制银行流水通过人工的方式录入成电子银行流水,为了避免错误,采用AB岗两人进行录入,录入到Excel之后,系统需要加载这两个Excel,并对两个Excel数据进行校对,看看是否录入一致:
public class ExchangerTest{
private static final Exchanger<String> exgr = new Exchanger<String>();
private static ExecutorServicethreadPool = Executors.newFixedThreadPool(2);
public static void main(String[] args){
threadPool.execute(new Runnable(){
public void run(){
String A = "银行流水A";
exgr.exchange(A);
}
});
threadPool.execute(new Runnable(){
public void run(){
String B = "银行流水B";
String A = exgr.exchange("B");
System.out.println("A和B数据是否一致:"+A.equals(B)+");
}
});
threadPool.shutdown();
}
}
如果两个线程有一个没有执行exchange()方法,则会一直等待,如果担心有特殊情况发生,避免一直等待,可以使用exchange(V x,longtimeout,TimeUnit unit)设置最大等待时长。