fork-join
fork-join两种方式
1、介绍
Fork/Join 框架是 Java7 提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。在多核计算机中正确使用可以很好的发挥cpu的作用,提高程序的执行效率。框架采用工作窃取算法,当有子任务线程处理完当前任务时,它会从其他线程执行的任务队列里窃取任务来执行,从而提高整体的执行效率。为了减少线程间的任务资源竞争,队列通常使用双端队列,别窃取任务线程永远从啥UN广大UN队列的呕吐不获取任务执行,而窃取任务的线程永远从双端队列的尾部获取任务执行。
2、使用
根据业务场景来考虑是否需要使用Fork/Join框架来进行任务的拆分和汇总操作。当需要时,比如说需要执行一个很大的业务计算之类的,此时使用Fork/Join框架分以下两步:
对任务进行分割 把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小
执行分割的子任务并汇总结果 分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据
具体实现以上两步:
创建ForkJoinTask 它提供在任务中执行 fork() 和 join() 操作的机制,通常情况下我们不需要直接继承 ForkJoinTask 类,而只需要继承它的子类,Fork/Join 框架提供了以下两个子类:
RecursiveAction:用于没有返回结果的任务
RecursiveTask :用于有返回结果的任务
使用ForkJoinPool执行ForkJoinTask 任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务
3、示例
方法一
package com.ceShi.ForkJoin;
import java.util.concurrent.RecursiveTask;
/**
* @version 0.0.1
* @program: springboot-rabbitmq
* @description: 使用fork
* @author: huangzq
* @create: 2020-08-20 19:42
*/
public class SumTask extends RecursiveTask<Integer> {
private static final Integer THRESHOLD = 1000;
private int start;
private int end;
public SumTask(int start, int end) {
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
Integer sum = 0;
boolean isOk = (end - start) <= THRESHOLD;
if (isOk) {
for (int i = start; i <= end; i++) {
//此处是把任务拆小然后处理任务
sum += i;
}
return sum;
}
int middle = (end + start) / 2;
//子任务递归
SumTask sumSubTask = new SumTask(start, middle);
SumTask sumSubTask1 = new SumTask(middle + 1, end);
//fork子任务
sumSubTask.fork();
sumSubTask1.fork();
//join子任务
Integer join = sumSubTask.join();
Integer join1 = sumSubTask1.join();
sum = join + join1;
//计算结果 任务结果
return sum;
}
}
方法二
package com.ceShi.ForkJoin;
import java.util.concurrent.RecursiveTask;
/**
* @version 0.0.1
* @program: springboot-rabbitmq
* @description: 使用invokeAll
* @author: huangzq
* @create: 2020-08-20 19:43
*/
public class SumTask2 extends RecursiveTask<Integer> {
private static final Integer THRESHOLD = 1000;
private int start;
private int end;
public SumTask2(int start, int end) {
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
Integer sum = 0;
boolean isOk = end - start <= THRESHOLD;
if (isOk) {
for (int i = start; i <= end; i++) {
//此处是把任务拆小然后处理任务
sum += i;
}
// System.out.println(String.format("compute %d-%d = %d", start, end, sum));
return sum;
}
//除以2
int middle = (end + start) / 2;
//子任务递归
// System.out.println(String.format("fork %d-%d => %d-%d&%d-%d", start, end, start, middle - 1, middle, end));
SumTask2 sumSubTask = new SumTask2(start, middle - 1);
SumTask2 sumSubTask1 = new SumTask2(middle, end);
//fork子任务
invokeAll(sumSubTask, sumSubTask1);
//join子任务
Integer join = sumSubTask.join();
Integer join1 = sumSubTask1.join();
sum = join + join1;
//计算结果 任务结果
return sum;
}
}
测试速度
package com.ceShi.ForkJoin;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.ForkJoinTask;
/**
* @version 0.0.1
* @program: springboot-rabbitmq
* @description: 测试forkJoin
*
* 从结果(可以多次运行测试)可以看出,使用invokeAll方式效率比使用单独fork方式高,所以在使用时尽量采用invokeAll方式,这样可以充分利用线程池中的线程去执行任务
*
* @author: huangzq
* @create: 2020-08-20 19:45
*/
public class TestForkJoin {
public static void main(String[] args) {
Integer start = 0;
Integer end = 43333000;
ForkJoinPool fjp2 = new ForkJoinPool();
SumTask2 sumTask2 = new SumTask2(start, end);
long begin3 = System.currentTimeMillis();
Integer invoke = fjp2.invoke(sumTask2);
long end3 = System.currentTimeMillis();
System.out.println("计算结果3为 sum = " + invoke + ",计算时长为" + begin3 + "-" + end3 + "--- " + (end3 - begin3) + "ms");
ForkJoinPool fjp = new ForkJoinPool();
SumTask sumTask = new SumTask(start, end);
long begin2 = System.currentTimeMillis();
ForkJoinTask<Integer> submit = fjp.submit(sumTask);
Integer join = submit.join();
long end2 = System.currentTimeMillis();
System.out.println("计算结果2为 sum = " + join + ",计算时长为" + begin2 + "-" + end2 + "--- " + (end2 - begin2) + "ms");
}
}
转载:https://www.cnblogs.com/kingsonfu/p/11172118.html
下载代码到本地测试,(可以多次运行测试)可以看出,使用invokeAll方式效率比使用单独fork方式高,所以在使用时尽量采用invokeAll方式,这样可以充分利用线程池中的线程去执行任务。