什么是Fork/Join框架
Fork/Join框架是Java7提供的并行执行任务的框架,是把大任务分割成若干小任务,最终汇总每个小任务结果后得到大任务结果的框架。
再从字面意思来理解一下Fork/Join框架的意思,Fork就是切分大任务成小任务并行执行,Join就是合并小任务的结果得到大任务的结果。
Fork/Join框架流程图如下:
工作窃取算法
工作窃取(Work-Stealing)算法是指某个线程从其他队列中窃取任务来执行。工作窃取流程图如下:
为什么要使用此算法?我们要执行一个大任务时,把大任务分割成若干互不依赖的小任务,为了减少线程间的竞争,于是把每个子任务分别放到不同的队列中,并为每个队列创建一个单独线程来执行此队列中的任务,此时线程与队列一一对应。线程在执行任务时,有的线程会先执行完队列中的任务,其他线程还未执行完,此时,执行完任务的线程就会从其他线程的队列中窃取一个任务来执行。此时就会有多个线程同时访问一个任务队列,为了减少窃取任务线程和被窃取线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从队列的头部拿任务执行,而窃取任务线程永远从对俩的尾部拿任务执行,直至队列中任务执行完毕。
工作窃取算法充分利用线程进行并行计算,并且减少了线程间的竞争,但是此算法也是有缺点的,就是在某些情况下还是存在多线程间的竞争,例如队列中只有一个任务时,此时就会有竞争,而且还会消耗更多的系统资源,比如创建多个线程和多个双端队列。
Java中Fork/Join框架介绍
上述说明了Fork/Join框架的需求,我们可以看下Java中是如何实现此框架的。
- 分割任务,需要一个Fork类来分割任务,有可能任务很大,需要递归分割,直到分割的任务足够小;
- 执行任务,将分割的小任务分别放到双端队列中,然后启动线程从双端队列中获取任务并执行;
- 合并结果,小任务的执行结果会放到各自队列中,此时启动一个线程从各个队列中获取结果数据合并成最终结果。
Fork/Join使用一下两个类来完成以上三件事情:
- ForkJoinTask:我们要使用ForkJoin框架,必须首先创建一个ForkJoin任务。它提供在任务中执行fork()和join()操作的机制,通常情况下我们不需要直接继承ForkJoinTask类,而只需要继承它的子类,Fork/Join框架提供了以下两个子类:
RecursiveAction:用于没有返回结果的任务。
RecursiveTask :用于有返回结果的任务。 - ForkJoinPool :ForkJoinTask需要通过ForkJoinPool来执行,任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务。
Fork/Join框架的使用
我们通过一个简单的例子来使用一下这个框架,例子:计算1+2+······+10的计算结果。
任务分割:每个子任务最多执行5个数的相加,那设置的廓值就是5,那就是分割成2个子任务即可。
执行任务:第一个任务执行1-5的和,第二个任务执行6-10的和
合并结果:第一个任务和+第二个任务和
例子:
package com.hongguo.java7.forkjoin;
import java.util.concurrent.RecursiveTask;
/**
* 由于需要返回值,所以继承RecursiveTask类
*/
public class CountTask extends RecursiveTask<Integer> {
private static final int THRESHOLD = 5;
private int start;
private int end;
public CountTask(int start, int end) {
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
int sum = 0;
boolean canCompute = (end - start) <= THRESHOLD;
// 任务小就直接计算
if (canCompute) {
for (int i = start; i <= end; i++) {
sum += i;
}
} else {
// 如果任务大于廓值,则分割成2个子任务计算
int middle = (start + end) / 2;
CountTask countTask1 = new CountTask(start, middle);
CountTask countTask2 = new CountTask(middle + 1, end);
// 执行子任务
countTask1.fork();
countTask2.fork();
// 等待子任务执行完,得到执行结果
int leftResult = countTask1.join();
int rightResult = countTask2.join();
// 合并子任务结果
sum = leftResult + rightResult;
}
return sum;
}
public static void main(String[] args) throws Exception {
ForkJoinPool pool = new ForkJoinPool();
CountTask task = new CountTask(1, 10);
Future<Integer> future = pool.submit(task);
System.out.println(future.get());
}
}
说明:ForkJoinTask与一般任务的主要区别在于需要实现compute方法,此方法中首先需要判断任务是否足够小,如果足够小就直接执行任务。如果不是足够小(大于我们设置的廓值时),就必须分割成两个子任务,子任务在调用fork方法时,又会进入compute方法,看看当前子任务是否需要继续分割成孙任务,如果不需要继续分割,则执行当前子任务并返回结果。使用join方法会等待子任务执行完并得到其结果。