除了通用的ThreadPoolExecutor
之外,Java还提供了一个有特殊用途的线程池,即ForkJoinPool
。这个类跟ThreadPoolExecutor类大体相似,实现了Executor
和ExecutorService
接口。当使用这些接口的时候,ForkJoinPool
会使用一个无界队列来存储任务,这些任务由线程池构造函数中指定的线程数执行。如果没有设置线程数的话,则默认使用当前机器可用CPU数或者Docker容器中配置的CPU数大小的线程数量。
ForkJoinPool往往用于实现分治算法,将一个任务分解成多个具备可加性的子任务,然后可以并行执行这些子任务最后将子任务的运算结果进行一次聚合运算得到最终结果,比如快速排序算法。
对于分治算法的使用,有一点需要注意,就是它往往会创建大量任务,但是你不太可能创建跟任务数量相当的线程来执行它们。举个例子,要对一个1000万个元素的数组进行排序,那么分解子任务的流程是这样子:对数组对半拆分后进行排序,再对两个子数组进行一次合并,这个过程可以递归化,直到子数组长度为奇数或者说长度已经很小的时候。
假设分解直到子数组长度<=47的时候,那么现在有262144个用于对子数组进行排序的任务,有131072个用于合并这些子数组的任务,合并后的子任务还需要额外的65536个任务进行再一次合并,以此类推,最终会产生524287个任务。
不难发现,直到子任务完成之前,其父任务是无法执行的,如果我们用ThreadPoolExecutor来实现该算法,性能会相当差。但是ForkJoinPool中的线程,则不需要在子任务完成之前保持等待,当任务被暂停的时候,它可以去执行其他待处理的任务。
举个简单的例子:现在有一个double类型的数组,需要计算数组中小于0.5的元素的数量,我们使用分治策略来完成这个任务。
public class TestForkJoinPool { private static double[] d; private class ForkJoinTask extends RecursiveTask<Integer> { private int first; private int last; public ForkJoinTask(int first,