关于Java中流式编程与ForkJoinPool的一点事

一、前言

最近在看项目代码时候,发现有一段奇怪的代码,细看完全多余,然而这其中却隐藏着一个不为人知的关于 ForkJoinPool 的秘密...

二、流式编程基础

如下代码我们首先创建了一个list,然后从list上获取流对象,并使用foreach进行遍历:

public static void main(String[] args) throws IOException {
        // 1.创建list
        ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < 100; ++i) {
            arrayList.add(i + "");
        }
        arrayList.stream().forEach(e -> System.out.println(Thread.currentThread().getName() + " " + e));
}

运行上面代码,输出为:

main 0
main 1
main 2
main 3
main 4
...

上面打印元素使用的main线程顺序进行的,大家都知道我们可以把流转换为并行流,代码如下:

    public static void main(String[] args) throws IOException {
        // 1.创建list
        ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < 100; ++i) {
            arrayList.add(i + "");
        }
        arrayList.parallelStream().forEach(e -> System.out.println(Thread.currentThread().getName() + " " + e));
}

运行上面代码输出如下:

ForkJoinPool.commonPool-worker-6 94
main 73
main 74
ForkJoinPool.commonPool-worker-6 95
ForkJoinPool.commonPool-worker-1 39
ForkJoinPool.commonPool-worker-3 69
ForkJoinPool.commonPool-worker-3 70  
...

上面代码则是使用ForkJoinPool的common线程池与main线程并行输出的,另外我们知道我们无法对流式的并行处理的线程池线程数量进行定制,其内部使用的是整个JVM内唯一的common线程池。

二、猜执行结果

上面我们介绍了流式编程的并行流,下面请看下面代码输出时候,打印的线程名称是什么:

 //代码示例1
    private static final ForkJoinPool pool = new ForkJoinPool(3);
    public static void main(String[] args) throws IOException {
        // 1.创建list
        ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < 100; ++i) {
            arrayList.add(i + "");
        }
        pool.submit(() -> arrayList.parallelStream().forEach(e -> {
            System.out.println(Thread.currentThread().getName() + " " + e);
        })).join();
        System.out.println("Main is over");
}

阅读上面代码,我们可以看到main线程向forkjoin线程池里面添加了一个任务,然后阻塞等待任务的完成,然后打印输出Main is over。

那么这与不提交任务到线程池,而是直接执行,如下代码,看起来没啥区别:

 //代码示例2
    public static void main(String[] args) throws IOException {
        // 1.创建list
        ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < 100; ++i) {
            arrayList.add(i + "");
        }
        arrayList.parallelStream().forEach(e -> System.out.println(Thread.currentThread().getName() + " " + e));
        System.out.println("Main is over");
}

如上代码,我们也是在main线程等待打印任务执行完毕后,在输出Main is over。

其实不然,如上代码示例1中,我们创建了一个名称为pool的线程池,然后向其中提交了一个任务。

运行上面代码后pool中会创建一个ForkJoinWorkerThread类型的线程,来执行我们提交的任务,也就是执行

arrayList.stream().forEach(e -> System.out.println(Thread.currentThread().getName() + " " + e));

运行上面代码,按理说是ForkJoinPool中的common线程池线程并行,执行打印输出。但是运行后你会发现打印任务的线程却是我们自己创建的pool中的线程,也就是我们使用自己创建的pool替代了并行流默认的ForkJoinPool中的common线程池。

究其原因是当我们调用并行流的forEach方法时候,会调用到ForkJoinTask的fork方法进行子任务切分:

    public final ForkJoinTask<V> fork() {
        Thread t;
        if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)
            ((ForkJoinWorkerThread)t).workQueue.push(this);
        else
            ForkJoinPool.common.externalPush(this);
        return this;
    }

由于调用forEach的是我们自己创建的pool里面的线程(其是ForkJoinWorkerThread类型的),所以会把切分的任务添加到我们调用线程所在的队列里面,而不是添加到了common线程池里面。

三、总结

虽然通过本文介绍的方法可以切换并行流执行的线程池,但是这种方式并不是正规的方法,理解成本也高,不推荐使用。如果真的需要自己定制线程池进行并行执行,则可以直接基于ForkJoinPool实现,而不是使用并行流的方式。

戳下面阅读

????

我的第三本书    我的第二本书    我的第一本书

golang并发教程    关于技术面试    K8s网络模型

人生需规划   再见阿里巴巴

Java并发编程视频分享第一期 Java并发编程视频分享-第二期

点亮再看哦????

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值