java并发编程 9:线程池(重点)

为什么使用线程池

线程其实也是一种系统资源,每次创建线程,都会创建对应的栈内存,如果线程非常多,那么可能会占用非常多的系统资源。

另外一方面,线程也不是越多越好的,CPU资源是有限的,即使有很多线程,还是需要等待CPU调度分配资源,还有上下文切换等,也是非常耗时的操作。

所以就有了线程池的概念。

所谓的线程池其实就是一批线程的集合,这些线程可以得到重复利用,这样减少了内存占用和线程数量,也减少了上下文切换。

使用线程池主要有以下三个原因:

  1. 创建/销毁线程需要消耗系统资源,线程池可以复用已创建的线程
  2. 控制并发的数量。并发数量过多,可能会导致资源消耗过多,从而造成服务器崩溃。(主要原因)
  3. 可以对线程做统一管理

ThreadPoolExecutor

构造方法

在java中,使用ThreadPoolExecutor来实现线程池。其中构造方法有很多,最全的方法如下:

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)

下面看下各个参数什么意思:

  1. int corePoolSize:该线程池中核心线程数最大值

    核心线程:线程池中有两类线程,核心线程和非核心线程(又叫救急线程)。核心线程默认情况下会一直存在于线程池中,即使这个核心线程什么都不干(铁饭碗),而非核心线程如果长时间的闲置,就会被销毁(临时工)。

  2. int maximumPoolSize:该线程池中线程总数最大值 。该值等于核心线程数量 + 非核心线程数量。

  3. long keepAliveTime:非核心线程闲置超时时长。非核心线程如果处于闲置状态超过该值,就会被销毁。如果设置allowCoreThreadTimeOut(true),则会也作用于核心线程。

  4. TimeUnit unit:keepAliveTime的单位。

    TimeUnit是一个枚举类型 ,包括以下属性:

    NANOSECONDS : 1微毫秒 = 1微秒 / 1000 MICROSECONDS : 1微秒 = 1毫秒 / 1000 MILLISECONDS : 1毫秒 = 1秒 /1000 SECONDS : 秒 MINUTES : 分 HOURS : 小时 DAYS : 天

  5. BlockingQueue workQueue:阻塞队列,维护着等待执行的Runnable任务对象

    常用的几个阻塞队列:

    • LinkedBlockingQueue:链式阻塞队列,底层数据结构是链表,默认大小是Integer.MAX_VALUE,也可以指定大小。
    • ArrayBlockingQueue:数组阻塞队列,底层数据结构是数组,需要指定队列的大小。
    • SynchronousQueue:同步队列,内部容量为0,每个put操作必须等待一个take操作,反之亦然。
    • DelayQueue:延迟队列,该队列中的元素只有当其指定的延迟时间到了,才能够从队列中获取到该元素 。
  6. ThreadFactory threadFactory:非必须参数。创建线程的工厂 ,用于批量创建线程,统一在创建线程时设置一些参数,如是否守护线程、线程的优先级等。如果不指定,会新建一个默认的线程工厂。

  7. RejectedExecutionHandler handler拒绝处理策略,线程数量大于最大线程数就会采用拒绝处理策略。

    jdk 提供了 4 种实现拒绝策略,如下:

    • ThreadPoolExecutor.AbortPolicy默认拒绝处理策略,丢弃任务并抛出RejectedExecutionException异常。
    • ThreadPoolExecutor.DiscardPolicy:丢弃新来的任务,但是不抛出异常。
    • ThreadPoolExecutor.DiscardOldestPolicy:丢弃队列头部(最旧的)的任务,然后重新尝试执行程序(如果再次失败,重复此过程)。
    • ThreadPoolExecutor.CallerRunsPolicy:由调用线程自己处理该任务。

线程池的状态

线程池本身有一个调度线程,这个线程就是用于管理布控整个线程池里的各种任务和事务,例如创建线程、销毁线程、任务队列管理、线程队列管理等等。

故线程池也有自己的状态。ThreadPoolExecutor类中定义了一个volatile int变量runState来表示线程池的状态 ,分别为RUNNING、SHURDOWN、STOP、TIDYING 、TERMINATED。

ThreadPoolExecutor 使用 int 的高 3 位来表示线程池状态,低 29 位表示线程数量。

状态名高 3 位接收新任务处理阻塞队列任务说明
RUNNING111YN
SHUTDOWN000NY不会接收新任务,但会处理阻塞队列剩余任务
STOP001NN会中断正在执行的任务,并抛弃阻塞队列
TIDYING010--任务全执行完毕,活动线程为 0 即将进入终结
TERMINATED011--终结状态

从数字上比较,TERMINATED > TIDYING > STOP > SHUTDOWN > RUNNING。

这些信息存储在一个原子变量(AtomicInteger) ctl 中,目的是将线程池状态与线程个数合二为一,这样就可以用一次 cas 原子操作进行赋值。

// c 为旧值, ctlOf 返回结果为新值
ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))));
// rs 为高 3 位代表线程池状态, wc 为低 29 位代表线程个数,ctl 是合并它们
private static int ctlOf(int rs, int wc) { return rs | wc; }

线程池的工作策略如下:

  • 线程池创建后处于RUNNING状态。

  • 调用shutdown()方法后处于SHUTDOWN状态,线程池不能接受新的任务,清除一些空闲worker,会等待阻塞队列的任务完成。

  • 调用shutdownNow()方法后处于STOP状态,线程池不能接受新的任务,中断所有线程,阻塞队列中没有被执行的任务全部丢弃。此时,poolsize=0,阻塞队列的size也为0。

  • 当所有的任务已终止,ctl记录的”任务数量”为0,线程池会变为TIDYING状态。接着会执行terminated()函数。

  • 线程池处在TIDYING状态时,执行完terminated()方法之后,就会由 TIDYING -> TERMINATED, 线程池被设置为TERMINATED状态。

线程池任务处理流程

处理任务的核心方法是execute,我们看看 JDK 1.8 源码中ThreadPoolExecutor是如何处理线程任务的:

// JDK 1.8 
public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException(); 
  	// 获取线程池状态
    int c = ctl.get();
    // 1.当前线程数小于corePoolSize,则调用addWorker创建核心线程执行任务
    if (workerCountOf(c) < corePoolSize) {
       if (addWorker(command, true))
           return;
       c = ctl.get();
    }
    // 2.如果不小于corePoolSize,则将任务添加到workQueue队列。
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 2.1 如果isRunning返回false(状态检查),则remove这个任务,然后执行拒绝策略。
        if (! isRunning(recheck) && remove(command))
            reject(command);
            // 2.2 线程池处于running状态,但是没有线程,则创建线程
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    // 3.如果放入workQueue失败,则创建非核心线程执行任务,
    // 如果这时创建非核心线程失败(当前线程总数不小于maximumPoolSize时),就会执行拒绝策略。
    else if (!addWorker(command, false))
         reject(command);
}

ctl.get()是获取线程池状态,用int类型表示。第二步中,入队前进行了一次isRunning判断,入队之后,又进行了一次isRunning判断。

为什么要二次检查线程池的状态?

在多线程的环境下,线程池的状态是时刻发生变化的。很有可能刚获取线程池状态后线程池状态就改变了。判断是否将command加入workqueue是线程池之前的状态。倘若没有二次检查,万一线程池处于非RUNNING状态(在多线程环境下很有可能发生),那么command永远不会执行。

总结一下处理流程

  1. 线程总数量 < corePoolSize,无论线程是否空闲,都会新建一个核心线程执行任务(让核心线程数量快速达到corePoolSize,在核心线程数量 < corePoolSize时)。注意,这一步需要获得全局锁。
  2. 线程总数量 >= corePoolSize时,新来的线程任务会进入任务队列中等待,然后空闲的核心线程会依次去缓存队列中取任务来执行(体现了线程复用)。
  3. 当缓存队列满了,说明这个时候任务已经多到爆棚,需要一些“临时工”来执行这些任务了。于是会创建非核心线程去执行这个任务。注意,这一步需要获得全局锁。
  4. 缓存队列满了, 且总线程数达到了maximumPoolSize,则会采取上面提到的拒绝策略进行处理。

线程池种类

说明:

下面要说的线程池的创建都是通过Executors创建,但是阿里的开发规范里,不推荐使用Executors去创建线程池,而是通过ThreadPoolExecutor的方式创建,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。 主要因为允许的请求队列长度为Integer.MAX_VALUE,可能会堆积大量的请求,从而导致OOM。

但如果如果本身对线程池非常熟悉,又确定业务规模不会大到资源耗尽的程度(比如线程数量或任务队列长度可能达到Integer.MAX_VALUE)时,其实是可以使用JDK提供的这几个接口的,它能让我们的代码具有更强的可读性。

newFixedThreadPool

固定大小线程池

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
}

核心线程数量和总线程数量都是传入的参数nThreads,两者相等,所以只能创建核心线程,不能创建非核心线程。因为LinkedBlockingQueue的默认大小是Integer.MAX_VALUE,即是无界队列,队列里的线程数量可以非常大。

如果核心线程空闲,则交给核心线程处理;如果核心线程不空闲,则入列等待,直到核心线程空闲。

在 getTask() 方法,如果队列里没有任务可取,线程会一直阻塞在 LinkedBlockingQueue.take() ,线程不会被回收,会一直卡在阻塞,所以没有任务的情况下, FixedThreadPool占用资源更多

示例:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

@Slf4j
public class FixedThreadPoolTest01 {
    public static void main(String[] args) {
        ExecutorService pool = Executors.newFixedThreadPool(2);
        pool.execute(() -> {
            log.info("线程1");
        });
        pool.execute(() -> {
            log.info("线程2");
        });
        pool.execute(() -> {
            log.info("线程3");
        });

    }
}

执行如下:

2023-07-03 00:24:35,528 - 0    INFO  [pool-1-thread-1] up.cys.chapter07.FixedThreadPoolTest01:18  - 线程1
2023-07-03 00:24:35,528 - 0    INFO  [pool-1-thread-2] up.cys.chapter07.FixedThreadPoolTest01:21  - 线程2
2023-07-03 00:24:35,538 - 10   INFO  [pool-1-thread-1] up.cys.chapter07.FixedThreadPoolTest01:24  - 线程3

执行程序后,发现程序并没有停下来,后面会说如何处理。

还可以看到打印出的线程名字,比如第一个[pool-1-thread-1],是使用的默认的线程工厂创建的名字,默认的线程工厂代码如下:

DefaultThreadFactory() {
    SecurityManager s = System.getSecurityManager();
    group = (s != null) ? s.getThreadGroup() :
                          Thread.currentThread().getThreadGroup();
    namePrefix = "pool-" +
                  poolNumber.getAndIncrement() +
                 "-thread-";
}

还可以使用自己创建的线程工厂,如下:

@Slf4j
public class FixedThreadPoolTest01 {
    public static void main(String[] args) {
        ExecutorService pool = Executors.newFixedThreadPool(2, new ThreadFactory() {
            private AtomicInteger t = new AtomicInteger(1);
            @Override
            public Thread newThread(Runnable r) {
                return new Thread(r, "myPool-" + t.getAndIncrement());
            }
        });
        pool.execute(() -> {
            log.info("线程1");
        });
        pool.execute(() -> {
            log.info("线程2");
        });
        pool.execute(() -> {
            log.info("线程3");
        });

    }
}

适用于任务量已知,相对耗时的任务。

newCachedThreadPool

带缓冲的线程池

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

其特点是,核心线程数是 0, 最大线程数是 Integer.MAX_VALUE,救急线程的空闲生存时间是 60s。

也就是说它的线程全部都是救急线程(60s 后可以回收),且救急线程可以无限创建。

另外,队列采用了 SynchronousQueue 实现特点是,它没有容量,没有其他线程来取会阻塞住,任务放不进去的(一手交钱、一手交货)。

CacheThreadPool的运行流程如下:

  1. 提交任务进线程池。
  2. 因为corePoolSize为0的关系,不创建核心线程,线程池最大为Integer.MAX_VALUE。
  3. 尝试将任务添加到SynchronousQueue队列。
  4. 如果SynchronousQueue入列成功,立马当前空闲的线程拉取执行。如果当前没有空闲线程,那么就创建一个非核心线程,然后从SynchronousQueue拉取任务并在当前线程执行。
  5. 如果SynchronousQueue已有任务在等待,入列操作将会阻塞。

当需要执行很多短时间的任务时,CacheThreadPool的线程复用率比较高, 会显著的提高性能。而且线程60s后会回收,意味着即使没有任务进来,CacheThreadPool并不会占用很多资源。

整个线程池表现为线程数会根据任务量不断增长,没有上限,当任务执行完毕,空闲 1分钟后释放线程。 适合任务数比较密集,但每个任务执行时间较短的情况。

FixedThreadPool是因为阻塞队列可以很大(最大为Integer最大值),故几乎不会触发拒绝策略;CachedThreadPool是因为线程池很大(最大为Integer最大值),几乎不会导致线程数量大于最大线程数,故几乎不会触发拒绝策略。

newSingleThreadExecutor

public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(1, 1,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>()));
}

有且仅有一个核心线程( corePoolSize == maximumPoolSize=1),使用了LinkedBlockingQueue(容量很大),所以,不会创建非核心线程。所有任务按照先来先执行的顺序执行。如果这个唯一的线程不空闲,那么新来的任务会存储在任务队列里等待执行。

newScheduledThreadPool

创建一个定长线程池,支持定时及周期性任务执行。

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
    return new ScheduledThreadPoolExecutor(corePoolSize);
}

//ScheduledThreadPoolExecutor():
public ScheduledThreadPoolExecutor(int corePoolSize) {
    super(corePoolSize, Integer.MAX_VALUE,
          DEFAULT_KEEPALIVE_MILLIS, MILLISECONDS,
          new DelayedWorkQueue());
}

示例:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;


@Slf4j
public class ScheduledExecutorTest01 {
    public static void main(String[] args) {
        ScheduledExecutorService pool = Executors.newScheduledThreadPool(2);

        log.info("开始");

        // 创建一个任务,延迟一秒执行
        pool.schedule(() -> {
            log.info("task1");
          	int i = 1 / 0;
        }, 1, TimeUnit.SECONDS);

        pool.schedule(() -> {
            log.info("task2");
        },1, TimeUnit.SECONDS);

    }
}

执行结果如下:

2023-07-03 21:54:48,434 - 0    INFO  [main] up.cys.chapter07.ScheduledExecutorTest01:19  - 开始
2023-07-03 21:54:49,450 - 1016 INFO  [pool-1-thread-1] up.cys.chapter07.ScheduledExecutorTest01:23  - task1
2023-07-03 21:54:49,452 - 1018 INFO  [pool-1-thread-2] up.cys.chapter07.ScheduledExecutorTest01:27  - task2

可以看到,除了延迟1秒执行外,任务1执行异常并不会影响任务2。

除了执行延迟任务,还可以使用scheduleAtFixedRate执行定时任务,如下:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;


@Slf4j
public class ScheduledExecutorTest02 {
    public static void main(String[] args) {
        ScheduledExecutorService pool = Executors.newScheduledThreadPool(2);

        log.info("开始");

        // 参数里第一个1是延迟多少秒开始第一次执行任务,第二个1是每隔1秒执行一次
        pool.scheduleAtFixedRate(() -> {
            log.info("running...");
        }, 1, 1, TimeUnit.SECONDS);
        
    }
}

执行程序后会每隔1秒打印一下。需要注意的是,如果任务的执行时间(假如2s)大于了间隔时间(假如1s),那么还是得等上次执行完才能再执行下次,也就是得每隔2秒执行一次。

另外还有一个方法,是scheduleWithFixedDelay,他的时间间隔是从上次任务结束开始算的,而上面的是从上次任务开始就算了。这里不再演示。

线程池常用方法

提交任务

  1. execute

普通的执行任务方法

void execute(Runnable command);
  1. submit

提交任务 task,用返回值 Future 获得任务执行结果

<T> Future<T> submit(Callable<T> task);

示例:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.ExecutionException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.Future;


@Slf4j
public class SubmitTest {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService pool = Executors.newFixedThreadPool(2);

        Future<String> future = pool.submit(() -> {
            log.info("running");
            Thread.sleep(1000);
            return "ok";
        });

        log.info("结果:{}", future.get());
    }
}

注意使用future.get()或阻塞等待结果。

  1. invokeAll

提交 tasks 中所有任务

<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks) throws InterruptedException;
// 带超时时间
<T> List<Future<T>> invokeAll(Collection<? extends Callable<T>> tasks, long timeout, TimeUnit unit) throws InterruptedException;

4 .invokeAny

提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消

<T> T invokeAny(Collection<? extends Callable<T>> tasks) throws InterruptedException, ExecutionException;
// 带超时时间
<T> T invokeAny(Collection<? extends Callable<T>> tasks, long timeout, TimeUnit unit) throws InterruptedException, ExecutionException, TimeoutException;

关闭线程池

  1. shutdown

线程池状态变为 SHUTDOWN,且

  • 不会接收新任务
  • 已提交到队列的任务会执行完
  • 不会阻塞调用线程的执行,也就是调用线程池的线程调用此方法,会接着向下运行

源码如下:

public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
      	// 修改线程池状态
        advanceRunState(SHUTDOWN);
      	// 仅会打断空闲线程
        interruptIdleWorkers();
        onShutdown(); //  扩展点 ScheduledThreadPoolExecutor
    } finally {
        mainLock.unlock();
    }
  	// 尝试终结(没有运行的线程可以立刻终结,如果还有运行的线程也不会等)
    tryTerminate();
}
  1. shutdownNow

线程池状态变为 STOP,且:

  • 不会接收新任务
  • 将队列中的任务返回
  • 并用 interrupt 的方式中断正在执行的任务

源码如下:

public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
      	// 修改线程池状态
        advanceRunState(STOP);
      	// 打断所有线程
        interruptWorkers();
        // 获取队列中剩余任务
        tasks = drainQueue();
    } finally {
        mainLock.unlock();
    }
  // 尝试终结
    tryTerminate();
    return tasks;
}

线程池状态

// 不在 RUNNING 状态的线程池,此方法就返回 true
boolean isShutdown();
// 线程池状态是否是 TERMINATED
boolean isTerminated();
// 调用 shutdown 后,由于调用线程并不会等待所有任务运行结束,因此如果它想在线程池 TERMINATED 后做些事情,可以利用此方法等待
boolean awaitTermination(long timeout, TimeUnit unit) throws InterruptedException;

线程池大小设置

线程池大小设置过小会导致程序不能充分地利用系统资源、容易导致饥饿,过大会导致更多的线程上下文切换,占用更多内存。

下面有经验公式可以参考

  1. CPU 密集型运算

通常采用 cpu 核数 + 1 能够实现最优的 CPU 利用率,+1 是保证当线程由于页缺失故障(操作系统)或其它原因导致暂停时,额外的这个线程就能顶上去,保证 CPU 时钟周期不被浪费。

  1. I/O 密集型运算

CPU 不总是处于繁忙状态,例如,当你执行业务计算时,这时候会使用 CPU 资源,但当你执行 I/O 操作时、远程RPC 调用时,包括进行数据库操作时,这时候 CPU 就闲下来了,你可以利用多线程提高它的利用率。

经验公式如下

线程数 = 核数 * 期望 CPU 利用率 * 总时间(CPU计算时间+等待时间) / CPU 计算时间

例如 4 核 CPU 计算时间是 50% ,其它等待时间是 50%,期望 cpu 被 100% 利用,套用公式:

4 * 100% * 100% / 50% = 8

例如 4 核 CPU 计算时间是 10% ,其它等待时间是 90%,期望 cpu 被 100% 利用,套用公式:

4 * 100% * 100% / 10% = 40

Fork / join

原理

Fork/Join 是 JDK 1.7 加入的新的线程池实现,它体现的是一种分治思想,适用于能够进行任务拆分的 cpu 密集型运算。

所谓的任务拆分,是将一个大任务拆分为算法上相同的小任务,直至不能拆分可以直接求解。跟递归相关的一些计算,如归并排序、斐波那契数列、都可以用分治思想进行求解。

Fork/Join 在分治的基础上加入了多线程,可以把每个任务的分解和合并交给不同的线程来完成,进一步提升了运算效率。

Fork/Join 默认会创建与 cpu 核心数大小相同的线程池。

Fork/Join框架使用一个巧妙的算法来平衡线程的负载,称为工作窃取(work-stealing)算法。

假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。

工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。

使用

Fork/Join内部大量运用了位操作和无锁算法。该框架主要涉及三大核心组件:ForkJoinPool(线程池)、ForkJoinTask(任务)、ForkJoinWorkerThread(工作线程),外加WorkQueue(任务队列):

  • ForkJoinPool:ExecutorService的实现类,负责工作线程的管理、任务队列的维护,以及控制整个任务调度流程;
  • ForkJoinTask:Future接口的实现类,fork是其核心方法,用于分解任务并异步执行;而join方法在任务结果计算完毕之后才会运行,用来合并或返回计算结果;
  • ForkJoinWorkerThread:Thread的子类,作为线程池中的工作线程(Worker)执行任务;
  • WorkQueue:任务队列,用于保存任务

要定义一个任务,通常我们不需要字节继承ForkJoinTask,而只需要继承它的子类,Fork/Join框架提供了以下两个子类:

  • RecursiveAction:用于没有返回结果的任务。
  • RecursiveTask :用于有返回结果的任务。

继承后实现它的compute方法,也就是具体执行的任务内容。

以一个对 1~n 之间的累加任务为例:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;

public class ForkJoinTest  {
    public static void main(String[] args) {
        // 提交给 ForkJoinPool 来执行
        ForkJoinPool pool = new ForkJoinPool(4);
        System.out.println(pool.invoke(new AddTask1(5)));
    }

}

@Slf4j
class AddTask1 extends RecursiveTask<Integer> {
    int n;

    public AddTask1(int n) {
        this.n = n;
    }

    @Override
    public String toString() {
        return "{" + n + '}';
    }

    @Override
    protected Integer compute() {
        // 如果 n 已经为 1,可以求得结果了
        if (n == 1) {
        log.info("join() {}", n);
        return n;
        }

        // 将任务进行拆分(fork)
        AddTask1 t1 = new AddTask1(n - 1);
        t1.fork();
        log.info("fork() {} + {}", n, t1);

        // 合并(join)结果
        int result = n + t1.join();
        log.info("join() {} + {} = {}", n, t1, result);
        return result;
    }
}

执行结果如下:

2023-07-05 22:21:05,194 - 0    INFO  [ForkJoinPool-1-worker-7] up.cys.chapter07.AddTask1:47  - fork() 3 + {2}
2023-07-05 22:21:05,194 - 0    INFO  [ForkJoinPool-1-worker-3] up.cys.chapter07.AddTask1:47  - fork() 5 + {4}
2023-07-05 22:21:05,194 - 0    INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:47  - fork() 4 + {3}
2023-07-05 22:21:05,194 - 0    INFO  [ForkJoinPool-1-worker-1] up.cys.chapter07.AddTask1:47  - fork() 2 + {1}
2023-07-05 22:21:05,203 - 9    INFO  [ForkJoinPool-1-worker-7] up.cys.chapter07.AddTask1:40  - join() 1
2023-07-05 22:21:05,210 - 16   INFO  [ForkJoinPool-1-worker-1] up.cys.chapter07.AddTask1:51  - join() 2 + {1} = 3
2023-07-05 22:21:05,211 - 17   INFO  [ForkJoinPool-1-worker-7] up.cys.chapter07.AddTask1:51  - join() 3 + {2} = 6
2023-07-05 22:21:05,211 - 17   INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:51  - join() 4 + {3} = 10
2023-07-05 22:21:05,211 - 17   INFO  [ForkJoinPool-1-worker-3] up.cys.chapter07.AddTask1:51  - join() 5 + {4} = 15
15

用图来表示

在这里插入图片描述

因为上面我们计算n为5的任务时,还要等待n为4的任务的结果,同理后面也是,这样效率略低。针对上面的例子我们还可以来改进:给任务传两个值,计算两个值之间的累加,代码如下:

import lombok.extern.slf4j.Slf4j;

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;

public class ForkJoinTest  {
    public static void main(String[] args) {
        // 提交给 ForkJoinPool 来执行
        ForkJoinPool pool = new ForkJoinPool(4);
        System.out.println(pool.invoke(new AddTask1(1, 10)));
    }

}

@Slf4j
class AddTask1 extends RecursiveTask<Integer> {
    int begin;
    int end;

    public AddTask1(int begin, int end) {
        this.begin = begin;
        this.end = end;
    }

    @Override
    public String toString() {
        return  "{" + begin + "," + end + '}';
    }

    @Override
    protected Integer compute() {
        // 5, 5
        if (begin == end) {
            log.debug("join() {}", begin);
            return begin;
        }

        // 4, 5
        if (end - begin == 1) {
            log.debug("join() {} + {} = {}", begin, end, end + begin);
            return end + begin;
        }

        // 1 5
        int mid = (end + begin) / 2;  // 3


        // 将任务进行拆分(fork)
        AddTask1 t1 = new AddTask1(begin, mid); // 1,3
        t1.fork();
        AddTask1 t2 = new AddTask1(mid + 1, end); // 4, 5
        t2.fork();
        log.info("fork() {} + {} = ?", t1, t2);

        // 合并(join)结果
        int result = t1.join() + t2.join();
        log.info("join() {} + {} = {}", t1, t2, result);
        return result;
    }
}

执行结果如下:

2023-07-07 20:17:13,256 - 0    INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:61  - fork() {1,3} + {4,5} = ?
2023-07-07 20:17:13,277 - 21   INFO  [ForkJoinPool-1-worker-3] up.cys.chapter07.AddTask1:61  - fork() {1,5} + {6,10} = ?
2023-07-07 20:17:13,266 - 10   INFO  [ForkJoinPool-1-worker-7] up.cys.chapter07.AddTask1:61  - fork() {6,8} + {9,10} = ?
2023-07-07 20:17:13,256 - 0    INFO  [ForkJoinPool-1-worker-1] up.cys.chapter07.AddTask1:61  - fork() {6,7} + {8,8} = ?
2023-07-07 20:17:13,311 - 55   INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:61  - fork() {1,2} + {3,3} = ?
2023-07-07 20:17:13,318 - 62   INFO  [ForkJoinPool-1-worker-1] up.cys.chapter07.AddTask1:65  - join() {6,7} + {8,8} = 21
2023-07-07 20:17:13,319 - 63   INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:65  - join() {1,2} + {3,3} = 6
2023-07-07 20:17:13,320 - 64   INFO  [ForkJoinPool-1-worker-7] up.cys.chapter07.AddTask1:65  - join() {6,8} + {9,10} = 40
2023-07-07 20:17:13,320 - 64   INFO  [ForkJoinPool-1-worker-5] up.cys.chapter07.AddTask1:65  - join() {1,3} + {4,5} = 15
2023-07-07 20:17:13,322 - 66   INFO  [ForkJoinPool-1-worker-3] up.cys.chapter07.AddTask1:65  - join() {1,5} + {6,10} = 55
55

用图来表示如下:
在这里插入图片描述

参考
https://redspider.gitbook.io/concurrent/di-san-pian-jdk-gong-ju-pian/12
https://blog.csdn.net/weixin_49561445/article/details/120597781

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ethan-running

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值