fork Java_Java Fork/Join 框架

简介

从JDK1.7开始,Java提供Fork/Join框架用于并行执行任务,它的思想就是讲一个大任务分割成若干小任务,最终汇总每个小任务的结果得到这个大任务的结果。

这种思想和MapReduce很像(input --> split --> map --> reduce --> output)

主要有两步:

第一、任务切分;

第二、结果合并

它的模型大致是这样的:线程池中的每个线程都有自己的工作队列(PS:这一点和ThreadPoolExecutor不同,ThreadPoolExecutor是所有线程公用一个工作队列,所有线程都从这个工作队列中取任务),当自己队列中的任务都完成以后,会从其它线程的工作队列中偷一个任务执行,这样可以充分利用资源。

工作窃取(work-stealing)

工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。工作窃取的运行流程图如下:

bed690836331520f0f56840f3950d746.png

那么为什么需要使用工作窃取算法呢?

假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。

工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。

API介绍

ForkJoinPool

An ExecutorService for running ForkJoinTasks.

A ForkJoinPool differs from other kinds of ExecutorService mainly by virtue of employing work-stealing: all threads in the pool attempt to find and execute tasks submitted to the pool and/or created by other active tasks (eventually blocking waiting for work if none exist). This enables efficient processing when most tasks spawn other subtasks (as do most ForkJoinTasks), as well as when many small tasks are submitted to the pool from external clients. Especially when setting asyncMode to true in constructors, ForkJoinPools may also be appropriate for use with event-style tasks that are never joined.

ForkJoinPool与其它的ExecutorService区别主要在于它使用“工作窃取”:线程池中的所有线程都企图找到并执行提交给线程池的任务。当大量的任务产生子任务的时候,或者同时当有许多小任务被提交到线程池中的时候,这种处理是非常高效的。特别的,当在构造方法中设置asyncMode为true的时候这种处理更加高效。

38f5c7890346b952137e0953fc030616.png

ForkJoinTask

ForkJoinTask代表运行在ForkJoinPool中的任务。

主要方法:

fork()    在当前线程运行的线程池中安排一个异步执行。简单的理解就是再创建一个子任务。

join()    当任务完成的时候返回计算结果。

invoke()    开始执行任务,如果必要,等待计算完成。

子类:

RecursiveAction    一个递归无结果的ForkJoinTask(没有返回值)

RecursiveTask    一个递归有结果的ForkJoinTask(有返回值)

ForkJoinWorkerThread

A thread managed by a ForkJoinPool, which executes ForkJoinTasks.

ForkJoinWorkerThread代表ForkJoinPool线程池中的一个执行任务的线程。

类图

763d30b35c1cba205b6679cce522a1ef.png  

560d8c0082abc4b91eea9a42bb460521.png  

b48bb83f4578616a2b68545c78e0800b.png

代码分析

接下来,简略的看一下关键代码来加深对Fork/Join的理解。

ForkJoinPool

WorkQueue是一个ForkJoinPool中的内部类,它是线程池中线程的工作队列的一个封装,支持任务窃取。

什么叫线程的任务窃取呢?就是说你和你的一个伙伴一起吃水果,你的那份吃完了,他那份没吃完,那你就偷偷的拿了他的一些水果吃了。存在执行2个任务的子线程,这里要讲成存在A,B两个个WorkQueue在执行任务,A的任务执行完了,B的任务没执行完,那么A的WorkQueue就从B的WorkQueue的ForkJoinTask数组中拿走了一部分尾部的任务来执行,可以合理的提高运行和计算效率。

25a8776922c32215852522a837a66487.png

submit()

f5ae98d86db5c9028f3cea9fd4d27f30.png

792d8e9eacea32f6f1212ffa2580e06e.png

62cac375959fc4ebb8b2d2d96d8093ff.png

可以看到:

同样是提交任务,submit会返回ForkJoinTask,而execute不会

任务提交给线程池以后,会将这个任务加入到当前提交者的任务队列中。

前面我们说过,每个线程都有一个WorkQueue,而WorkQueue中有执行任务的线程(ForkJoinWorkerThread owner),还有这个线程需要处理的任务(ForkJoinTask>[] array)。那么这个新提交的任务就是加到array中。

ForkJoinWorkerThread

edec8112135fb858e6c8e673119e6710.png

从代码中我们可以清楚地看到,ForkJoinWorkThread持有ForkJoinPool和ForkJoinPool.WorkQueue的引用,以表明该线程属于哪个线程池,它的工作队列是哪个

ForkJoinTask

fork()

74a04bcad629137a069b54f505af6942.png

可以看到,如果是ForkJoinWorkerThread运行过程中fork(),则直接加入到它的工作队列中,否则,重新提交任务。

join()和invoke()

10224caa1694adea9cac77c104711c7a.png

e83f5c015f1551cd99546bf8f27bccdb.png

可以看到它们都会等待计算完成

图形化处理过程

下面盗两张图

c5c58a9768bd90ff7ddec3e66a7f09ea.png

fdb719ca1009cc341609542187fc97cb.png

63131d921ce77f6887e7475c9d750f08.png

cb5e6a1a5204537181841e83ac10a23e.png

使用示例

批量发送消息

1 packagecom.cjs.boot.demo;2

3 importjava.util.ArrayList;4 importjava.util.List;5 importjava.util.concurrent.ForkJoinPool;6 importjava.util.concurrent.RecursiveAction;7 importjava.util.concurrent.TimeUnit;8

9 public classForkJoinPoolDemo {10

11 class SendMsgTask extendsRecursiveAction {12

13 private final int THRESHOLD = 10;14

15 private intstart;16 private intend;17 private Listlist;18

19 public SendMsgTask(int start, int end, Listlist) {20 this.start =start;21 this.end =end;22 this.list =list;23 }24

25 @Override26 protected voidcompute() {27

28 if ((end - start) <=THRESHOLD) {29 for (int i = start; i < end; i++) {30 System.out.println(Thread.currentThread().getName() + ": " +list.get(i));31 }32 }else{33 int middle = (start + end) / 2;34 invokeAll(new SendMsgTask(start, middle, list), newSendMsgTask(middle, end, list));35 }36

37 }38

39 }40

41 public static void main(String[] args) throwsInterruptedException {42 List list = new ArrayList<>();43 for (int i = 0; i < 123; i++) {44 list.add(String.valueOf(i+1));45 }46

47 ForkJoinPool pool = newForkJoinPool();48 pool.submit(new ForkJoinPoolDemo().new SendMsgTask(0, list.size(), list));49 pool.awaitTermination(10, TimeUnit.SECONDS);50 pool.shutdown();51 }52

53 }

求和

1 packagecom.cjs.boot.demo;2

3 importjava.util.concurrent.ExecutionException;4 importjava.util.concurrent.ForkJoinPool;5 importjava.util.concurrent.ForkJoinTask;6 importjava.util.concurrent.RecursiveTask;7

8 public classForkJoinTaskDemo {9

10 private class SumTask extends RecursiveTask{11

12 private static final int THRESHOLD = 20;13

14 private intarr[];15 private intstart;16 private intend;17

18 public SumTask(int[] arr, int start, intend) {19 this.arr =arr;20 this.start =start;21 this.end =end;22 }23

24 /**

25 * 小计26 */

27 privateInteger subtotal() {28 Integer sum = 0;29 for (int i = start; i < end; i++) {30 sum +=arr[i];31 }32 System.out.println(Thread.currentThread().getName() + ": ∑(" + start + "~" + end + ")=" +sum);33 returnsum;34 }35

36 @Override37 protectedInteger compute() {38

39 if ((end - start) <=THRESHOLD) {40 returnsubtotal();41 }else{42 int middle = (start + end) / 2;43 SumTask left = newSumTask(arr, start, middle);44 SumTask right = newSumTask(arr, middle, end);45 left.fork();46 right.fork();47

48 return left.join() +right.join();49 }50 }51 }52

53 public static void main(String[] args) throwsExecutionException, InterruptedException {54 int[] arr = new int[100];55 for (int i = 0; i < 100; i++) {56 arr[i] = i + 1;57 }58

59 ForkJoinPool pool = newForkJoinPool();60 ForkJoinTask result = pool.submit(new ForkJoinTaskDemo().new SumTask(arr, 0, arr.length));61 System.out.println("最终计算结果: " +result.invoke());62 pool.shutdown();63 }64

65 }

ForkJoinPool.commonPool-worker-2: ∑(50~62)=678ForkJoinPool.commonPool-worker-2: ∑(62~75)=897ForkJoinPool.commonPool-worker-2: ∑(75~87)=978ForkJoinPool.commonPool-worker-2: ∑(87~100)=1222ForkJoinPool-1-worker-1: ∑(0~12)=78ForkJoinPool-1-worker-1: ∑(12~25)=247ForkJoinPool-1-worker-1: ∑(25~37)=378ForkJoinPool-1-worker-1: ∑(37~50)=572ForkJoinPool-1-worker-2: ∑(75~87)=978ForkJoinPool-1-worker-3: ∑(50~62)=678ForkJoinPool-1-worker-5: ∑(62~75)=897ForkJoinPool.commonPool-worker-7: ∑(0~12)=78ForkJoinPool.commonPool-worker-3: ∑(37~50)=572ForkJoinPool-1-worker-4: ∑(87~100)=1222ForkJoinPool.commonPool-worker-2: ∑(25~37)=378ForkJoinPool.commonPool-worker-5: ∑(12~25)=247最终计算结果:5050

api文档中的两个示例

1 packagecom.cjs.boot.demo;2

3 importjava.util.Arrays;4 import java.util.concurrent.*;5

6 public classRecursiveActionDemo {7

8 private static class SortTask extendsRecursiveAction {9

10 static final int THRESHOLD = 100;11

12 final long[] array;13 final intlo, hi;14

15 public SortTask(long[] array, int lo, inthi) {16 this.array =array;17 this.lo =lo;18 this.hi =hi;19 }20

21 public SortTask(long[] array) {22 this(array, 0, array.length);23 }24

25 public void sortSequentially(int lo, inthi) {26 Arrays.sort(array, lo, hi);27 }28

29 public void merge(int lo, int mid, inthi) {30 long[] buf =Arrays.copyOfRange(array, lo, mid);31 for (int i = 0, j = lo, k = mid; i < buf.length; j++) {32 array[j] = (k == hi || buf[i] < array[k]) ? buf[i++] : array[k++];33 }34 }35

36 @Override37 protected voidcompute() {38 if (hi - lo >> 1;42 invokeAll(new SortTask(array, lo, mid), newSortTask(array, mid, hi));43 merge(lo, mid, hi);44 }45 }46 }47

48 public static void main(String[] args) throwsExecutionException, InterruptedException {49 long[] array = new long[120];50 for (int i = 0; i < array.length; i++) {51 array[i] = (long) (Math.random() * 1000);52 }53 System.out.println(Arrays.toString(array));54

55 ForkJoinPool pool = newForkJoinPool();56 pool.submit(newSortTask(array));57 pool.awaitTermination(5, TimeUnit.SECONDS);58 pool.shutdown();59

60 }61

62 }

1 packagecom.cjs.boot.demo;2

3 import java.util.concurrent.*;4

5 public classRecursiveTaskDemo {6

7 private static class Fibonacci extends RecursiveTask{8

9 final intn;10

11 public Fibonacci(intn) {12 this.n =n;13 }14

15 @Override16 protectedInteger compute() {17 if (n <= 1) {18 returnn;19 }else{20 Fibonacci f1 = new Fibonacci(n - 1);21 f1.fork();22 Fibonacci f2 = new Fibonacci(n - 1);23 return f2.compute() +f1.join();24 }25 }26 }27

28 public static void main(String[] args) throwsInterruptedException, ExecutionException {29 ForkJoinPool pool = newForkJoinPool();30 Future future = pool.submit(new Fibonacci(10));31 System.out.println(future.get());32 pool.shutdown();33 }34

35 }

参考

http://gee.cs.oswego.edu/dl/papers/fj.pdf

http://ifeve.com/talk-concurrency-forkjoin/

https://www.cnblogs.com/senlinyang/p/7885964.html

https://blog.csdn.net/u012403290/article/details/70917810

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值