java parallelStream底层原理

结论
  1. parallelStream 是线程不安全的
  2. parallelStream 适用的场景是 CPU 密集型的,只是做到别浪费 CPU ,假如本身电脑 CPU 的负载很大,那还到处用并行流,那并不能起到作用。
  3. I/O 密集型 磁盘 I/O 、网络 I/O 都属于 I/O 操作,这部分操作是较少消耗 CPU 资源,一般并行流中不适用于 I/O 密集型的操作,就比如使用并流行进行大批量的消息推送,涉及到了大量I/O ,使用并行流反而慢了很多。
  4. 在使用并行流的时候是无法保证元素的顺序的,也就是即使你用了同步集合也只能保证元素都正确但无法保证其中的顺序。
实现原理

parallelStream 使用的是 Fork/Join 框架。 Fork/Join 框架自 JDK 7 引入。 Fork/Join 框架可以将一个大任务拆分为很多小任务来异步执行。 Fork/Join 框架主要包含三个模块:

  1. 线程池: ForkJoinPool
  2. 任务对象: ForkJoinTask
  3. 执行任务的线程: ForkJoinWorkerThread

在这里插入图片描述

Fork/Join原理-分治法

ForkJoinPool 主要用来使用分治法 (Divide-and-Conquer Algorithm)来解决问题。
典型的应用比如快速排序算法,ForkJoinPool需要使用相对少的线程来处理大量的任务。比如要对 1000万个数据进行排序,那么会将这个任务分割成两个500 万的排序任务和一个针对这两组 500 万数据的合并任务。以此类推,对于 500万的数据也会做出同样的分割处 理,到最后会设置一个阈值来规定当数据规模到多少时,停止这样的分割处理。比如,当元素的数量小于10时,会停止分割,转而使用插入排序对它们进行排序。那么到最后,所有的任务加起来会有大概2000000+个。
问题的关键在于,对于一个任务而言,只有当它所有的子任务完成之后,它才能够被执行。

在这里插入图片描述

Fork/Join原理-工作窃取算法

Fork/Join 最核心的地方就是利用了现代硬件设备多核,在一个操作时候会有空闲的 cpu ,那么如何利用好这个空闲的cpu就成了提高性能的关键,而这里我们要提到的工作窃取( work-stealing )算法就是整个 Fork/Join 框架的核心理念Fork/Join工作窃取( work-stealing )算法是指某个线程从其他队列里窃取任务来执行。

在这里插入图片描述
那么为什么需要使用工作窃取算法呢?假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来 执行队列里的任务,线程和队列一一对应,比如A 线程负责处理 A 队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行

工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。

上文中已经提到了在 Java 8 引入了自动并行化的概念。它能够让一部分 Java 代码自动地以并行的方式执行,也就是我们使用了ForkJoinPool 的 ParallelStream 。

对于 ForkJoinPool 通用线程池的线程数量,通常使用默认值就可以了,即运行时计算机的处理器数量。可以通过设置系统属性:java.util.concurrent.ForkJoinPool.common.parallelism=N ( N 为线程数量),来调整 ForkJoinPool 的线程数量,可以尝试调整成不同的参数来观察每次的输出结果。

  • 13
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值