Executor框架（Java并发编程的艺术笔记）

最新推荐文章于 2024-08-03 15:03:17 发布

「已注销」

最新推荐文章于 2024-08-03 15:03:17 发布

阅读量200

点赞数

分类专栏： Java并发编程的艺术笔记

本文链接：https://blog.csdn.net/qq_39681830/article/details/105214477

版权

Java并发编程的艺术笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Executor框架简介

Executor框架的两级调度模型

在HotSpot VM的线程模型中，Java线程被一对一映射为本地操作系统线程，Java线程启动时会创建一个本地OS线程；当该Java线程终止时，这个OS线程也会被回收。OS会调度所有线程并将它们分配给可用的CPU。

在上层，Java多线程程序通常把应用分解为若干个任务，然后使用用户级的调度器（Excutor框架）将这些任务映射为固定数量的线程；在底层，OS内核(OSKernel)将这些线程映射到硬件处理器上。

由下图可看出，应用程序通过Executor框架控制上层的调度；而下层的调度由操作系统内核控制，下层的调度不受应用程序的控制。

Executor框架的结构与成员

Executor框架主要由3大部分组成：

任务。包括被执行任务需要实现的接口：Runnable接口或Callable接口
任务的执行。包括任务执行机制的核心接口Executor，以及继承自Executor的 ExecutorService接口。Executor框架有两个关键类实现了ExecutorService接口（ThreadPoolExecutor和ScheduledThreadPoolExecutor）。
异步计算的结果。包括接口Future和实现Future接口的FutureTask类

Executor框架包含的主要的类与接口如下所示，

（1）Executor是一个接口，它是Executor框架的基础，它将任务的提交与任务的执行分离。

（2）ThreadPoolExecutor是线程池的核心实现类，用来执行被提交的任务。

（3）ScheduledThreadPoolExecutor是一个实现类，可以在给定的延迟后运行命令，或者定期执行命令。ScheduledThreadPoolExecutor比Timer更灵活，功能更强大。

（4）Future接口和实现Future接口的FutureTask类，代表异步计算的结果。

（5）Runnable接口和Callable接口的实现类，都可以被ThreadPoolExecutor或ScheduledThreadPoolExecutor执行。

Executor框架的使用

（1）主线程首先要创建实现Runnable或者Callable接口的任务对象。工具类Executors可以把一个Runnable对象封装为一个Callable对象（Executors.callable（Runnable task）或 Executors.callable（Runnable task，Object resule））。

（2）以把Runnable对象直接交给ExecutorService执行（ExecutorService.execute（Runnable command））；或者也可以把Runnable对象或Callable对象提交给ExecutorService执行（ExecutorService.submit（Runnable task）或ExecutorService.submit（Callabletask））。

如果执行ExecutorService.submit（…），ExecutorService将返回一个实现Future接口的对象。由于FutureTask实现了Runnable，程序员也可以创建FutureTask，然后直接交给ExecutorService执行。

（3）主线程可以执行FutureTask.get()方法来等待任务执行完成。主线程也可以执行 FutureTask.cancel（boolean mayInterruptIfRunning）来取消此任务的执行。

Executor框架的主要成员

（1）ThreadPoolExecutor

ThreadPoolExecutor通常使用工厂类Executors来创建。Executors可以创建3种类型的 ThreadPoolExecutor：SingleThreadExecutor、FixedThreadPool和CachedThreadPool。

1）FixedThreadPool

创建使用固定线程数的方法如下。它适用于为满足资源管理，而需要限制当前线程数量的应用场景。如负载较重的服务器。

public static ExecutorService newFixedThreadPool(int nThreads)
public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory)

2）SingleThreadExecutor

创建使用单个线程的方法如下。它适用于需要保证顺序地执行各个任务；并且在任意时间点，不会有多个线程是活动的应用场景。

public static ExecutorService newSingleThreadExecutor()
public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory)

3）CachedThreadPool

创建一个会根据需要而创建新线程的方法如下。它是大小无界的线程池，适用于执行很多的短期异步任务的小程序，或者是负载较轻的服务器。

public static ExecutorService newCachedThreadPool()
public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory)

（2）ScheduledThreadPoolExecutor

ScheduledThreadPoolExecutor通常使用工厂类Executors来创建。Executors可以创建2种类型的ScheduledThreadPoolExecutor：

1）ScheduledThreadPoolExecutor

它适用于需要多个后台线程执行周期任务，同时为了满足资源管理的需求而需要限制后台线程数量的场景。它包含若干个线程

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize)
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize,ThreadFactory factory

2）SingleThreadScheduledExecutor

它适用于需要单个后台线程执行周期任务，同时需要保证顺序地执行各个任务的应用场景。

public static ScheduledExecutorService newSingleThreadScheduledExecutor()
public static ScheduledExecutorService newSingleThreadScheduledExecutor
(ThreadFactory threadFactory)

（3）Future接口

Future接口和实现Future接口的FutureTask类用来表示异步计算的结果。当我们把Runnable 接口或Callable接口的实现类提交（submit）给ThreadPoolExecutor或 ScheduledThreadPoolExecutor时，ThreadPoolExecutor或ScheduledThreadPoolExecutor会向我们返回一个FutureTask对象。

<T> Future<T> submit(Callable<T> task)
<T> Future<T> submit(Runnable task, T result)
Future<> submit(Runnable task)

注：截止至JDK8为止，Java通过上述API返回的是一个 FutureTask对象。但Java仅仅保证返回的是一个实现了Future接口的对象。在将来的JDK实现中，返回的可能不一定是FutureTask。

（4）Runnable接口和Callable接口

Runnable接口和Callable接口的实现类，都可以被ThreadPoolExecutor或ScheduledThreadPoolExecutor执行。它们之间的区别是Runnable不会返回结果，而Callable可以返回结果。

可以使用工厂类Executors来把一个 Runnable包装成一个Callable。

public static Callable<Object> callable(Runnable task)

我们也可以把一个Runnable和一个待返回的结果包装成一个Callable

public static <T> Callable<T> callable(Runnable task, T result)

ThreadPoolExecutor详解

Executor框架最核心的类是ThreadPoolExecutor，它是线程池的实现类，主要的参数如下：

corePool：核心线程数量。即使没有任务执行，核心线程也会一直存活
maximumPool：最大线程池的大小。
keepAliveTime：如果当前线程池中线程数大于corePoolSize，则多余的线程在等待keepAliveTime时间后如果还没有新的线程任务指派给它、它就会被回收。
BlockingQueue：用来暂时保存任务的工作队列。
RejectedExecutionHandler：当ThreadPoolExecutor已经关闭或ThreadPoolExecutor已经饱和时（达到了最大线程池大小且工作队列已满），execute()方法将要调用的Handler。

ThreadPoolExecutor有3种类型·FixedThreadPool，SingleThreadExecutor，CachedThreadPool。下面分别介绍

FixedThreadPool详解

它是可重用固定线程数的线程池，构造它的静态方法如下

public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
        0L, TimeUnit.MILLISECONDS,  new LinkedBlockingQueue<Runnable>());
}

FixedThreadPool的corePoolSize和maximumPoolSize参数都被设置为创建FixedThreadPool时指定的参数nThreads。

当线程池中的线程数大于corePoolSize时，keepAliveTime为多余的空闲线程等待新任务的最长时间，超过这个时间后多余的线程将被终止。这里把keepAliveTime设置为0L，意味着多余的空闲线程会被立即终止。

FixedThreadPool的execute()方法说明

当前运行的线程少于corePoolSize，则创建新线程执行任务。
当前运行的线程数等于corePoolSize，将任务加入LinkedBlockingQueue。
线程执行第1步中的任务后，会在循环中反复从LinkedBlockingQueue获取任务来执行。

FixedThreadPool使用无界队列LinkedBlockingQueue作为线程池的工作队列（队列的容量为 Integer.MAX_VALUE）。

当线程池中的线程数达到corePoolSize后，新任务将在无界队列中等待。因此线程池中的线程数不会超过corePoolSize。
使用无界队列时maximumPoolSize将是一个无效参数
使用无界队列时keepAliveTime将是一个无效参数
由于使用无界队列，运行中的FixedThreadPool不会拒绝任务（不会调用RejectedExecutionHandler.rejectedExecution方法）。

SingleThreadExecutor详解

它是使用单个worker线程的Executor，静态构造方法如下：

public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService(new ThreadPoolExecutor(1, 1,
        0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()));
}

corePoolSize和maximumPoolSize被设置为1。其他参数与 FixedThreadPool相同。

SingleThreadExecutor的execute()说明

如果当前运行的线程数少于corePoolSize（即线程池中无运行的线程），则创建一个新线程来执行任务。
当前线程池中有一个运行的线程，将任务加入入LinkedBlockingQueue。
线程执行完第一步的任务后，会在一个无限循环中反复从LinkedBlockingQueue获取任务来执行。

CachedThreadPool详解

它是一个会根据需要创建新线程的线程池，下面是创建的静态方法。

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS,
            new SynchronousQueue<Runnable>());
}

corePoolSize被设置为0，即corePool为空；maximumPoolSize被设置为 Integer.MAX_VALUE，即maximumPool是无界的；keepAliveTime设置为60L，表示CachedThreadPool中的空闲线程如果等待新任务超过60秒后将会被终止。

CachedThreadPool使用没有容量的SynchronousQueue作为线程池的工作队列，但 CachedThreadPool的maximumPool是无界的。因此，如果主线程提交任务的速度高于 maximumPool中线程处理任务的速度时，CachedThreadPool会不断创建新线程。极端情况下， CachedThreadPool会因为创建过多线程而耗尽CPU和内存资源。

SynchronousQueue是一个没有容量的阻塞队列。每个插入操作必须等待另一个线程的对应移除操作

CachedThreadPool的execute()方法说明

执行SynchronousQueue.offer（Runnable task）。如果当前maximumPool中有空闲线程正在执行SynchronousQueue.poll（keepAliveTime，TimeUnit.NANOSECONDS），那么空闲线程成功从队列取任务。execute()方法执行完成，否则执行下面步骤。
当初始maximumPool为空，或者maximumPool中当前没有空闲线程时，没有线程执行SynchronousQueue.poll（keepAliveTime，TimeUnit.NANOSECONDS）。此时CachedThreadPool会创建一个新线程执行任务，execute()方法执行完成。
在上步中新创建的线程执行完任务后，会执行SynchronousQueue.poll（keepAliveTime，TimeUnit.NANOSECONDS），该操作让空闲线程最多再队列中等待60s。

ScheduledThreadPoolExecutor详解

该类继承自ThreadPoolExecutor，主要用来在给定的延迟之后运行任务，或者定期执行任务。

ScheduledThreadPoolExecutor可以在构造函数中指定多个对应的后台线程数，而Timer对应的是单个后台线程。

ScheduledThreadPoolExecutor的运行机制

ScheduledThreadPoolExecutor使用的是支持延时获取元素的无界阻塞队列DelayQueue。

ScheduledThreadPoolExecutor执行主要分为两部分：

当调用ScheduledThreadPoolExecutor的scheduleAtFixedRate()方法或者scheduleWithFixedDelay()方法时，会向ScheduledThreadPoolExecutor的DelayQueue添加一个实现了 RunnableScheduledFutur接口的ScheduledFutureTask。
线程池中的线程从DelayQueue中获取ScheduledFutureTask，然后执行任务。

ScheduledThreadPoolExecutor的实现

ScheduledThreadPoolExecutor会把待调度的任务（ScheduledFutureTask）放到一个DelayQueue中。

ScheduledFutureTask主要包含3个成员变量：

long型成员变量time，表示这个任务将要被执行的具体时间。
long型成员变量sequenceNumber，表示这个任务被添加到ScheduledThreadPoolExecutor中的序号。
long型成员变量period，表示任务执行的间隔周期。

DelayQueue封装了一个PriorityQueue（优先级队列），这个PriorityQueue会对队列中的ScheduledFutureTask进行排序。排序时，time小的排在前面（时间早的任务将被先执行）。如果两个 ScheduledFutureTask的time相同，就比较sequenceNumber，sequenceNumber小的排在前面（如果两个任务的执行时间相同，那么先提交的任务将被先执行）。

ScheduledThreadPoolExecutor的任务执行步骤

线程1从从DelayQueue中获取已到期的ScheduledFutureTask（DelayQueue.take()）。到期任务是指ScheduledFutureTask的time大于等于当前时间，并执行任务。
线程1修改ScheduledFutureTask的time变量便为下次将要被执行的时间，并放入DelayQueue中（DelayQueue.add()）。

DelayQueue.take()方法

获取任务步骤如下：

获取锁
获取周期任务，若PriorityQueue为空，当前线程到Condition中等待；否则执行下一步
若PriorityQueue头元素的time参数比当前时间大，到Condition中等待直至time时间；否则执行下一步
获取PriorityQueue的头元素，若PriorityQueue不为空，则唤醒在Condition中等待的所有线程。
释放锁

    public E take() throws InterruptedException {
        final ReentrantLock lock = this.lock;
        lock.lockInterruptibly(); // 1
        try {
            for (;;) {
                E first = q.peek();
                if (first == null) {
                    available.await(); // 2
                } else {
                    long delay = first.getDelay(TimeUnit.NANOSECONDS);
                    if (delay > 0) {
                        long tl = available.awaitNanos(delay); // 3
                    } else {
                        E x = q.poll(); // 4
                        assert x != null;
                        if (q.size() != 0)
                            available.signalAll(); // 4
                        return x;
                    }
                }
            }
        } finally {
            lock.unlock(); // 6
        }
    }

ScheduledThreadPoolExecutor在一个循环中反复执行步骤2，直到线程从队列获取到一个元素后，才退出循环。

DelayQueue.offer()方法

添加任务步骤如下：

获取Lock
向PriorityQueue添加任务
若上一步添加的任务是队列的头元素，则唤醒在Condition中等待的所有线程
释放锁

    public boolean offer(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock(); // 1
        try {
            E first = q.peek();
            q.offer(e); // 2
            if (first == null || e.compareTo(first) < 0)
                available.signalAll(); // 3
            return true;
        } finally {
            lock.unlock(); // 4
        }
    }

FutureTask详解

FutureTask简介

FutureTask除了实现Future接口外，还实现了Runnable接口。因此，FutureTask可以交给 Executor执行，也可以由调用线程直接执行（FutureTask.run()）。当FutureTask.run()方法被执行时，FutureTask有下面3种状态：

未启动。FutureTask.run()方法还没有被执行之前，FutureTask处于未启动状态。当创建一个FutureTask，且没有执行FutureTask.run()方法之前，这个FutureTask处于未启动状态。
已启动。FutureTask.run()方法被执行的过程中，FutureTask处于已启动状态。
已完成。FutureTask.run()方法执行完后正常结束，或被取消（FutureTask.cancel（…）），或执行FutureTask.run()方法时抛出异常而异常结束，FutureTask处于已完成状态。

get()方法和cancel()之间的影响

当FutureTask处于未启动或已启动状态时，执行FutureTask.get()方法将导致调用线程阻塞。
当FutureTask处于已启动状态时，执行FutureTask.cancel（true）方法将以中断执行此任务线程的方式来试图停止任务；
当FutureTask处于已启动状态时，执行FutureTask.cancel（false）方法将不会对正在执行此任务的线程产生影响（让正在执行的任务运行完成）；
当FutureTask处于已完成状态时，执行FutureTask.cancel（…）方法将返回false。

FutureTask的使用

当一个线程需要等待另一个线程把某任务执行完后，他才能继续执行，此时可以用FutureTask。

测试：假设有多个线程执行若干个任务，每个任务最多只被执行一次，且只允许一个线程执行，其他线程需等待这个任务执行完后，才能继续执行。这些若干任务存储在currentHashMap

    final ConcurrentHashMap<Object, Future<String>> taskCache = new ConcurrentHashMap<>();

    String executionTask(final String taskName) throws Exception{
        while (true) {
            Future<String> future = taskCache.get(taskName);    // 1.1   2.1
            if(future == null) {
                Callable<String> task = new Callable<String>() {
                    @Override
                    public String call() throws Exception {
                        return taskName;
                    }
                };
                FutureTask<String> futureTask = new FutureTask<String>(task);  // 1.2
                future = taskCache.putIfAbsent(taskName, future);             // 1.3   
                if(future == null) {
                    futureTask.run();                                       //1.4
                }
            }
                return future.get();                // 1.5

        }
    }

代码执行示意图如下。当两个线程试图同时执行同一任务时，假设t1执行1.3后，t2执行2.1，则t2需在2.2中等待，直到t1执行完1.4后，t2才能从FutureTask.get()返回。

FutureTask的实现

FutureTask的实现基于AbstractQueuedSynchronizer（简称为AQS）。java.util.concurrent中的很多可阻塞类（比如ReentrantLock）都是基于AQS来实现的。基于于AQS实现的同步器包括：ReentrantLock、Semaphore、ReentrantReadWriteLock、 CountDownLatch和FutureTask。

每一个基于AQS实现的同步器都包括两种类型的操作：

至少一个基于acquire操作这个操作阻塞调用线程，除非/直到AQS的状态允许这个线程继续执行。FutureTask的acquire操作为get()/get（long timeout，TimeUnit unit）方法调用。
·至少一个release操作。这个操作改变AQS的状态，改变后的状态可允许一个或多个阻塞线程被解除阻塞。FutureTask的release操作包括run()方法和cancel（…）方法。

FutureTask声明了一个内部私有的继承于AQS的子类 Sync，Sync实现了AQS的tryAcquireShared（int）方法和tryReleaseShared（int）方法，Sync通过这两个方法来检查和更新同步状态。

如上图所示。FutureTask.get()方法会调用AQS.acquireSharedInterruptibly（int arg）方法，该方法执行过程如下：

调用AQS.acquireSharedInterruptibly（int arg）方法，这个方法首先会回调在子类Sync中实现的tryAcquireShared()方法来判断acquire操作是否可以成功。acquire操作可以成功的条件为： state为执行完成状态RAN或已取消状态CANCELLED，且runner不为null。
如果成功则get()方法立即返回。如果失败则到线程等待队列中去等待其他线程执行 release操作。
当其他线程执行release操作（比如FutureTask.run()或FutureTask.cancel（…））唤醒当前线程后，当前线程再次执行tryAcquireShared()将返回正值1，当前线程将离开线程等待队列并唤醒它的后继线程
最后返回计算的结果或抛出异常。

FutureTask.run()的执行过程

执行在构造函数中指定的任务（Callable.call()））。
以原子方式来更新同步状态（调用AQS.compareAndSetState（int expect，int update），设置 state为执行完成状态RAN）。如果这个原子操作成功，就设置代表计算结果的变量result的值为 Callable.call()的返回值，然后调用AQS.releaseShared（int arg）。
AQS.releaseShared（int arg）首先会回调在子类Sync中实现的tryReleaseShared（arg）来执行release操作（设置运行任务的线程runner为null，然会返回true）；AQS.releaseShared（int arg），然后唤醒线程等待队列中的第一个线程。
。当某个线程执行FutureTask.run()方法或FutureTask.cancel（...）方法时，会唤醒线程等待队列的第一个线程