Fork/Join
作为一个并发框架,是在 JDK7
的时候加入到 Java 并发包 java.util.concurrent
中来,并且在 JDK8 并行Stream流(parallel Stream)中充当着底层框架的角色
。
并行 Stream 流 使用的就是 Fork/Join 框架。Fork/Join 框架可以将一个大任务拆分为很多个小任务来异步执行。
Fork/Join 介绍
Fork/Join 框架主要包含三个模块:
线程池
:ForkJoinPool任务对象
:ForkJoinTask执行任务的线程
:ForkJoinWorkerThread
Fork/Join 原理介绍
1.分治法
ForkJoinPool 主要使用分治法(Divide-and-Conquer Algorithm)
来解决问题。根据名称我们可以将其分为 Fork
和 Join
两个阶段。典型的应用比如快速排序算法。
ForkJoinPool需要使用相对少的线程来处理大量的任务。比如要对 1000万个数据进行排序,那么会将这个任务分隔成两个 500万 的排序任务
和 一个针对这两组 500万 数据的合并任务
。以此类推,对于 500万 的数据也会做出同样的分隔处理,到最后会设置一个阈值来规定当数据规模到多少时,停止这样的分割处理操作。比如,当元素的数量小于 10 时,会停止分隔,转而使用插入排序对他们进行排序。那么到最后,所有的任务加起来有大概2000000+ 个。问题的关键自安于,对于一个任务而言,只有当它所有的子任务完成之后,它才能够被执行。
2.工作窃取算法
Fork/Join 最核心的地方,就是利用了现代硬件设备多核。当一个操作完成的时候会有空闲的CPU,那么如何利用好这个空闲的CPU就成了提高性能的关键,而我们这里提到的工作窃取(work-stealing)算法就是整个 Fork/Join 框架的核心理念。Fork/Join 工作窃取算法,是指某个线程从其他队列里窃取任务来执行。
那么为什么需要使用工作窃取算法呢?
假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竟争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应。比如 A 线程负责处理 A 队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着看,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。
工作窃取算法的优点
是充分利用线程进行并行计算,并减少了线程间的竞争
,其缺点
是①在某些情况下还是存在竞争,比如双端队列里只有一个任务时。
②消耗了更多的系统资源,比如创建多个线程和多个双端队列。
上文中已经提到了Java8 引入了自动并行化的概念。它能够让一部分 Java 代码自动地以并行的方式执行,也就是我们使用了 ForkjoinPool 的 ParallelStream。
对于 ForkJoinPool 通用线程池的线程数量,通常使用默认值就可以了,即运行时计算机的处理器数量。可以通过设置系统属性:java.util.concurrent.ForkJoinPool.common.parallelism = N(N 为线程数量),来调整 ForkJoinPool 的线程数量,可以尝试调整成不同的参数来观察每次的输出结果。
Fork/Join 案例Demo
需求:使用 Fork/Join 计算 1-10000的和,当一个任务的计算数量大于3000时拆分任务,数量小于3000时计算。
因为1~10000求和,耗时较少。下面我们将数据调大,求和1 ~ 59999999999(599亿),然后来对比一下使用 Fork/Join求和
和 普通求和
之间的效率差异。
1.普通求和
public class ForkJoinDemo {
public static void main(String[] args) {
//开始时间
Long start = System.currentTimeMillis();
long sum = 0l;
for (long i = 1; i <= 9999999999L; i++) {
sum+=i;
}
System.out.println(sum);
//结束时间
Long end = System.currentTimeMillis();
System.out.println("消耗时间:"+(end-start));
}
}
测试结果:高清图片点击放大
通过图片分析:(本机是8核心)
- 求和方法启动前,CPU处于平稳运行状态;
- 当求和方法启动后,CPU利用率会明显上升;
- 我们从图中CPU利用率发现,其实每个核心的利用率并不同,因为自己核的工作完成了就休息了,并不会去窃取其他核心的任务,所以资源并不能得到充分利用;
- 当求和结束后,所有CPU利用率又会降回到平稳状态
- 最终耗时:14394毫秒。
2.Fork/Join求和
/**
* TODO Fork/Join 求和Demo
*
* @author liuzebiao
* @Date 2020-1-14 17:03
*/
public class ForkJoinDemo {
public static void main(String[] args) {
Long start = System.currentTimeMillis();
//放入线程池
ForkJoinPool pool = new ForkJoinPool();
SumRecursiveTask task = new SumRecursiveTask(1, 59999999999L);
// 以下方式二选一(invoke和submit方式)
// 1.使用invoke()方法
Long result = pool.invoke(task);
// 2.使用submit() + get()方法
// ForkJoinTask<Integer> forkJoinTask = forkJoinPool.submit(task);
// Integer result = forkJoinTask.get();
System.out.println("result="+result);
Long end = System.currentTimeMillis();
System.out.println("消耗时间:"+(end-start));
}
}
//1.创建一个求和的任务
//RecursiveTask:表示一个任务
class SumRecursiveTask extends RecursiveTask<Long>{
//大于3000要拆分(创建一个变量)
//是否要拆分的临界值
private static final long THRESHOLD = 3000L;
//起始值
private final long start;
//结束值
private final long end;
//构造方法(传递起始值、结束值)
public SumRecursiveTask(long start, long end) {
this.start = start;
this.end = end;
}
//任务编写完成
@Override
protected Long compute() {
long length = end - start;
//计算
if(length < THRESHOLD){
long sum = 0;
for (long i = start; i <= end; i++) {
sum +=i;
}
return sum;
}else{
//拆分
long middle = (start + end) /2;
SumRecursiveTask left = new SumRecursiveTask(start,middle);
left.fork();
SumRecursiveTask right = new SumRecursiveTask(middle+1,end);
right.fork();
return left.join() +right.join();
}
}
}
测试结果:高清图片点击放大
通过图片分析:(本机是8核心)
- 求和方法启动前,CPU处于平稳运行状态;
- 当求和方法启动后,CPU利用率会明显上升;
- 因为 Fork/Join 算法使用工作窃取算法,我们发现在求和的过程中,每个核心的利用率都为100%,所以资源能够得到充分的利用;
- 当求和结束后,所有CPU利用率又会降回到平稳状态;
- 最终耗时:8880毫秒。
Fork/Join求和 用时相比 普通求和,效率提升40%
附:JDK8新特性(目录)
本目录为 JDK8新特性 学习目录,包含JDK8 新增全部特性的介绍。
如需了解,请跳转链接查看: 我是跳转链接
Fork/Join 框架,介绍到此为止
博主写作不易,来个关注呗
求关注、求点赞,加个关注不迷路 ヾ(◍°∇°◍)ノ゙
博主不能保证写的所有知识点都正确,但是能保证纯手敲,错误也请指出,望轻喷 Thanks♪(・ω・)ノ