JDK8辅助学习(六)：Fork/Join 框架

扛麻袋的少年

已于 2023-09-18 17:02:42 修改

阅读量2.8k

点赞数 2

分类专栏： JDK8新特性文章标签： forkjoin

于 2020-01-14 18:09:25 首次发布

本文链接：https://blog.csdn.net/lzb348110175/article/details/103977640

版权

JDK8新特性专栏收录该内容

15 篇文章 56 订阅

订阅专栏

Fork/Join作为一个并发框架，是在 JDK7 的时候加入到 Java 并发包 java.util.concurrent 中来，并且在 JDK8 并行Stream流(parallel Stream)中充当着底层框架的角色。

并行 Stream 流使用的就是 Fork/Join 框架。Fork/Join 框架可以将一个大任务拆分为很多个小任务来异步执行。

Fork/Join 介绍

Fork/Join 框架主要包含三个模块：

线程池：ForkJoinPool
任务对象：ForkJoinTask
执行任务的线程：ForkJoinWorkerThread

Fork/Join 原理介绍

1.分治法

ForkJoinPool 主要使用分治法（Divide-and-Conquer Algorithm）来解决问题。根据名称我们可以将其分为 Fork 和 Join 两个阶段。典型的应用比如快速排序算法。

ForkJoinPool需要使用相对少的线程来处理大量的任务。比如要对 1000万个数据进行排序，那么会将这个任务分隔成两个 500万的排序任务 和 一个针对这两组 500万数据的合并任务。以此类推，对于 500万的数据也会做出同样的分隔处理，到最后会设置一个阈值来规定当数据规模到多少时，停止这样的分割处理操作。比如，当元素的数量小于 10 时，会停止分隔，转而使用插入排序对他们进行排序。那么到最后，所有的任务加起来有大概2000000+ 个。问题的关键自安于，对于一个任务而言，只有当它所有的子任务完成之后，它才能够被执行。
在这里插入图片描述

2.工作窃取算法

Fork/Join 最核心的地方，就是利用了现代硬件设备多核。当一个操作完成的时候会有空闲的CPU，那么如何利用好这个空闲的CPU就成了提高性能的关键，而我们这里提到的工作窃取（work-stealing）算法就是整个 Fork/Join 框架的核心理念。Fork/Join 工作窃取算法，是指某个线程从其他队列里窃取任务来执行。
在这里插入图片描述
那么为什么需要使用工作窃取算法呢？假如我们需要做一个比较大的任务，我们可以把这个任务分割为若干互不依赖的子任务，为了减少线程间的竟争，于是把这些子任务分别放到不同的队列里，并为每个队列创建一个单独的线程来执行队列里的任务，线程和队列一一对应。比如 A 线程负责处理 A 队列里的任务。但是有的线程会先把自己队列里的任务干完，而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着看，不如去帮其他线程干活，于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列，所以为了减少窃取任务线程和被窃取任务线程之间的竞争，通常会使用双端队列，被窃取任务线程永远从双端队列的头部拿任务执行，而窃取任务的线程永远从双端队列的尾部拿任务执行。

工作窃取算法的优点是充分利用线程进行并行计算，并减少了线程间的竞争，其缺点是①在某些情况下还是存在竞争，比如双端队列里只有一个任务时。②消耗了更多的系统资源，比如创建多个线程和多个双端队列。

上文中已经提到了Java8 引入了自动并行化的概念。它能够让一部分 Java 代码自动地以并行的方式执行，也就是我们使用了 ForkjoinPool 的 ParallelStream。

对于 ForkJoinPool 通用线程池的线程数量，通常使用默认值就可以了，即运行时计算机的处理器数量。可以通过设置系统属性：java.util.concurrent.ForkJoinPool.common.parallelism = N（N 为线程数量），来调整 ForkJoinPool 的线程数量，可以尝试调整成不同的参数来观察每次的输出结果。

Fork/Join 案例Demo

需求:使用 Fork/Join 计算 1-10000的和，当一个任务的计算数量大于3000时拆分任务，数量小于3000时计算。
在这里插入图片描述
因为1~10000求和，耗时较少。下面我们将数据调大，求和1 ~ 59999999999(599亿)，然后来对比一下使用 Fork/Join求和 和 普通求和之间的效率差异。

1.普通求和

public class ForkJoinDemo {
    public static void main(String[] args) {
        //开始时间
        Long start = System.currentTimeMillis();
        long sum = 0l;
        for (long i = 1; i <= 9999999999L; i++) {
            sum+=i;
        }
        System.out.println(sum);
        //结束时间
        Long end = System.currentTimeMillis();
        System.out.println("消耗时间:"+(end-start));
    }
}

测试结果：高清图片点击放大
在这里插入图片描述
通过图片分析：(本机是8核心)

求和方法启动前，CPU处于平稳运行状态；
当求和方法启动后，CPU利用率会明显上升；
我们从图中CPU利用率发现，其实每个核心的利用率并不同，因为自己核的工作完成了就休息了，并不会去窃取其他核心的任务，所以资源并不能得到充分利用；
当求和结束后，所有CPU利用率又会降回到平稳状态
最终耗时：14394毫秒。

2.Fork/Join求和

/**
 * TODO Fork/Join 求和Demo
 *
 * @author liuzebiao
 * @Date 2020-1-14 17:03
 */
public class ForkJoinDemo {

    public static void main(String[] args) {
        Long start = System.currentTimeMillis();
        //放入线程池
        ForkJoinPool pool = new ForkJoinPool();
        SumRecursiveTask task = new SumRecursiveTask(1, 59999999999L);
        // 以下方式二选一(invoke和submit方式)
        // 1.使用invoke()方法
        Long result = pool.invoke(task);  
        // 2.使用submit() + get()方法
        // ForkJoinTask<Integer> forkJoinTask = forkJoinPool.submit(task);
        // Integer result = forkJoinTask.get();
        System.out.println("result="+result);
        Long end = System.currentTimeMillis();
        System.out.println("消耗时间:"+(end-start));
    }
}

//1.创建一个求和的任务
//RecursiveTask:表示一个任务
class SumRecursiveTask extends RecursiveTask<Long>{

    //大于3000要拆分(创建一个变量)
    //是否要拆分的临界值
    private static final long THRESHOLD = 3000L;

    //起始值
    private final long start;
    //结束值
    private final long end;

    //构造方法(传递起始值、结束值)
    public SumRecursiveTask(long start, long end) {
        this.start = start;
        this.end = end;
    }

    //任务编写完成
    @Override
    protected Long compute() {
        long length = end - start;
        //计算
        if(length < THRESHOLD){
            long sum = 0;
            for (long i = start; i <= end; i++) {
                sum +=i;
            }
            return sum;
        }else{
            //拆分
            long middle = (start + end) /2;
            SumRecursiveTask left = new SumRecursiveTask(start,middle);
            left.fork();

            SumRecursiveTask right = new SumRecursiveTask(middle+1,end);
            right.fork();
            return left.join() +right.join();
        }
    }
}

测试结果：高清图片点击放大
在这里插入图片描述
通过图片分析：(本机是8核心)

求和方法启动前，CPU处于平稳运行状态；
当求和方法启动后，CPU利用率会明显上升；
因为 Fork/Join 算法使用工作窃取算法，我们发现在求和的过程中，每个核心的利用率都为100%，所以资源能够得到充分的利用；
当求和结束后，所有CPU利用率又会降回到平稳状态；
最终耗时：8880毫秒。Fork/Join求和用时相比普通求和，效率提升40%

附：JDK8新特性（目录）

本目录为 JDK8新特性学习目录，包含JDK8 新增全部特性的介绍。

如需了解，请跳转链接查看：我是跳转链接

Fork/Join 框架，介绍到此为止

博主写作不易，来个关注呗

求关注、求点赞，加个关注不迷路ヾ(◍°∇°◍)ﾉﾞ

博主不能保证写的所有知识点都正确，但是能保证纯手敲，错误也请指出，望轻喷 Thanks♪(･ω･)ﾉ

扛麻袋的少年

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
1
评论
JDK8辅助学习(六)：Fork/Join 框架

Fork/Join 框架介绍      Fork/Join作为一个并发框架，是在 JDK7 的时候加入到 Java 并发包 java.util.concurrent 中来，并且在 JDK8 并行Stream流(parallel Stream)中充当着底层框架的角色。...
复制链接

扫一扫