java8 线程池 ThreadPoolExecutor 源码解析

最新推荐文章于 2021-08-25 10:38:13 发布

kdk0108

最新推荐文章于 2021-08-25 10:38:13 发布

阅读量518

点赞数 1

分类专栏：多线程文章标签：线程池 java

本文链接：https://blog.csdn.net/sinat_26158619/article/details/81224909

版权

多线程专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

在看 Java 线程池源码实现之前，只知道线程池是为了多线程执行任务时线程复用，防止创建过多的线程销毁系统资源。但是对线程复用只有一个模糊的概念，什么是线程复用，如何线程复用，确实说不出个所以然来。看过源码后，疑惑也就解决了。在线程池中它本身会创建一些线程，这些线程干嘛的呢？就是执行你扔到线程池里的 Runnable 的 run() 方法。说的更浅显点，你实现了 Thread 类和其 run() 方法，把 thread 提交到线程池中，这个线程池并不是调用 thread.start() 启动该线程。而是线程池本身存活着一些线程，这些线程的 run() 方法直接调用你提交到线程池的 Runnable的 run 方法。比如你线程池里面维持着 5 个线程，你提交 100 个 Runnale 给线程池，那么这 5个线程的 run 方法执行折 100 个 Runnable 的 run() 方法。这样就达到了线程复用，而不是启动这 100 个 Runnable。明白了这些，再看看线程池源码中是如何具体的实现的。

构造器

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue)

这是我们创建线程池常用的构造方法。

corePoolSize

线程池核心线程的数量，当线程池中添加任务的时候，每添加一个 Runnable 任务就会创建一个核心线程，直到数量达到 corePoolSize。

workQueue

队列，当核心线程已满，且都在执行任务的时候，再往线程池提交的任务会缓存在workQueue 中。

maximumPoolSize

线程池可以创建线程的上限数量。当线程池核心线程和 workQueue 都已经达到上限的情况下，再往线程池塞任务，会创建非核心线程来执行新任务，非核心线程和核心线程的数量和阈值为 maximumPoolSize。后文说的工作线程包括核心线程和非核心线程。

keepAliveTime

非核心线程空闲 keepAliveTime 时间后会进行回收。当然，核心线程也可以开启空闲 keepAliveTime 后进行回收，默认没有开启。

unit

keepAliveTime 的时间单位

通过构造器的参数介绍，也就大概明白线程池的大致逻辑了。

线程池状态

ThreadPoolExecutor 很巧妙的用一个原子变量 ct1 来代表线程池的状态和当前执行任务的数量。

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));

ct1 变量的 32 位的最高三位表示线程池状态，分别代表了 5 种状态：

 private static final int COUNT_BITS = Integer.SIZE - 3; // 等于29

    // runState is stored in the high-order bits
    private static final int RUNNING    = -1 << COUNT_BITS;
    private static final int SHUTDOWN   =  0 << COUNT_BITS;
    private static final int STOP       =  1 << COUNT_BITS;
    private static final int TIDYING    =  2 << COUNT_BITS;
    private static final int TERMINATED =  3 << COUNT_BITS;

Running:线程池可接收新任务，32 位的最高三位为 101，所以其值是 -1<<29

SHUTDOWN:线程池不再接收新任务，但是缓存在 workQueue 中的任务还会执行，最高三位为 000

STOP：线程池不再接收新任务，不再处理 workQueue 中的任务，正在执行的任务打上中断标志。状态为 001.

TIDYING:线程池中所有任务都已经暂停，线程池不再存活工作线程。可以通过 terminated() 钩子方法进入该状态。状态位为 010

TERMINATED: terminated() 执行完成。

从值大小的角度来看，各个状态值是从小到大的。那么各个状态是如何转换的呢？
当运行中的线程池执行 shutdown() 方法，会从 RUNNING 状态转到 SHUTDOWN。当执行 shutdownNow() 方法时，会从 RUNNING 或者 SHTDOWN 状态转换到 STOP 状态。当线程池没有线程存活且缓存队列为空时，会从 STOP 转换到 TIDYING。当钩子方法 terminated() 执行完成，会从 TIDYING 转换到 TERMINATED。这就是类似于线程池的生命周期了。

ctl 变量的后 29 位表示线程池的工作线程数量，所以创建工作线程的最大容量为：

private static final int CAPACITY   = (1 << COUNT_BITS) - 1; //2^29 -1

所以，我们可以通过 ctl 变量的最高三位得到当前线程池状态，后 29 位得到工作线程数量

private static int runStateOf(int c)     { return c & ~CAPACITY; } //获得状态值
    private static int workerCountOf(int c)  { return c & CAPACITY; } // 获得工作线程数量

execute

我们创建线程池对象后，通过 execute 方法将 Runnable 任务提交到线程池中执行。

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();

        int c = ctl.get(); // 表示状态和工作线程数量的变量值大小
        if (workerCountOf(c) < corePoolSize) { //工作线程数量小于核心线程数量
            if (addWorker(command, true)) //创建核心线程，执行 command 任务
                return;
            c = ctl.get();
        }
        if (isRunning(c) && workQueue.offer(command)) { //核心线程已满，检测任务是否能塞入缓存队列中
            int recheck = ctl.get(); //重新检查 ctl 值
            if (! isRunning(recheck) && remove(command)) //此时不处于 Running 状态，不接受新任务
                reject(command); //报错
            else if (workerCountOf(recheck) == 0)
            //没有工作线程，创建一个非核心工作线程，用来执行塞入队列中的任务
                addWorker(null, false);
        }
        else if (!addWorker(command, false))
         // 任务添加队列失败，看是否可以再添加一个工作线程，工作线程数在（corePoolSize, maximumPoolSize）之间
            reject(command);
    }

总体逻辑如下：
当线程池工作线程数量小于核心线程时，创建一个核心线程执行新任务;否则尝试将新任务塞入到缓存队列中，塞入成功后继续再次判断当前工作线程数量，如果此时没有工作线程了，创建一个非核心工作线程，用来执行塞入队列中的任务。（那么怎样读取队列中的任务并执行呢？后文将介绍）如果塞入队列失败，则尝试创建一个非核心线程执行新任务。

创建工作线程

那么如何创建工作线程执行任务呢？

/**
* core ： true 核心线程 false: 非核心线程
*/
 private boolean addWorker(Runnable firstTask, boolean core) {
        retry: //retry 循环
        for (;;) { //自旋锁
            int c = ctl.get();
            int rs = runStateOf(c); //线程池当前状态

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN && 
                    ! (rs == SHUTDOWN &&
                            firstTask == null &&
                            ! workQueue.isEmpty()))
                return false;

            for (;;) {
                int wc = workerCountOf(c); //当前工作线程数量
                if (wc >= CAPACITY ||
                        wc >= (core ? corePoolSize : maximumPoolSize))
                    return false;
                if (compareAndIncrementWorkerCount(c)) // ctl 的工作线程数量加1（原子操作）
                    break retry; //终止 retry循环
                c = ctl.get();  // Re-read ctl
                if (runStateOf(c) != rs)
                    continue retry;
                // else CAS failed due to workerCount change; retry inner loop
            }
        }

        boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
            w = new Worker(firstTask); //创建新的工作线程，work 为工作线程的包装类
            final Thread t = w.thread;
            if (t != null) {
                final ReentrantLock mainLock = this.mainLock;
                mainLock.lock(); 
                try {
                    // Recheck while holding lock.
                    // Back out on ThreadFactory failure or if
                    // shut down before lock acquired.
                    int rs = runStateOf(ctl.get()); //再次检测状态，防止多线程中被改动

                    if (rs < SHUTDOWN ||
                            (rs == SHUTDOWN && firstTask == null)) {
                            //线程池处于 Running 或者 SHUTDOWN 但是 firstTask 为 null 
                            //线程池 SHUTDOWN，缓存队列中有任务但是工作线程数量为0，此时也需要创建新线程进行处理
                        if (t.isAlive()) // precheck that t is startable
                            throw new IllegalThreadStateException();
                        workers.add(w); //保存新建的工作线程 work
                        int s = workers.size();  //当前线程池最新工作线程数量
                        if (s > largestPoolSize)
                            largestPoolSize = s;
                        workerAdded = true;
                    }
                } finally {
                    mainLock.unlock();
                }
                if (workerAdded) {
                    t.start(); //启动工作线程
                    workerStarted = true;
                }
            }
        } finally {
            if (! workerStarted)
                addWorkerFailed(w); //启动工作线程失败，报错
        }
        return workerStarted;
    }

整个添加新的工作线程逻辑就是判断当前线程池的状态，根据不同的状态做出不同处理。
这里需要根据 ctl 值作出不通的操作，所以需要 ReentrantLock 锁保证多线程安全性。
当需要创建一个新的工作线程时，会将任务塞到 Worker 中， Worker 是工作线程的封装类，Worker 的 run() 方法会执行 firstTask 的run() 方法，这是线程复用的原理所在。所以必须看看 Work 类。

Worker – 工作线程封装类

private final class Worker
            extends AbstractQueuedSynchronizer
            implements Runnable
    {

        private static final long serialVersionUID = 6138294804551838833L;
        final Thread thread;
        Runnable firstTask;
        volatile long completedTasks;

        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask; // 保存新任务
            this.thread = getThreadFactory().newThread(this); //创建Worker线程
        }

        /** Delegates main run loop to outer runWorker  */
        public void run() {
            runWorker(this); //委托给 runWorker()
        }
    }

Worker 是内部类，它本身继承了 Runnable。

addWorker(Runnable firstTask, boolean core){
    ....
     w = new Worker(firstTask);  
     ...
     final Thread t = w.thread;
     ....
     t.start();

}

可以看到，在前面介绍的创建工作线程方法中，创建了新的 worker 实例， t 指向 Worker 构造器创建的 worker 线程，所以 t.start() 启动的是 Worker 的 run() 方法执行。Worker 的 run() 方法委托给 runWorker(this) 实现。

runWorker 方法

final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask; // worker 中插入的新任务
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                        (Thread.interrupted() &&
                                runStateAtLeast(ctl.get(), STOP))) &&
                        !wt.isInterrupted())
                        //shouDownNow() 后，如果本线程没有打中断标记，则打上
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run(); //执行任务的 run() 方法
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null; //task 执行完置 null
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

可见，Runnable 任务是在 runWorker 中执行的。这样一来，前面的逻辑就可以串联起来了。当往线程池提交一个 Runnable 任务，判断完线程池的状态和工作线程数量后，当需要创建新的工作线程执行该任务时，就创建一个 Worker 线程实例，并传入该任务，启动 Worker 线程，在 Worker 线程的 run() 方法中执行任务的 run() 方法。这样，任务就被执行了。

这时候，你可能会有疑惑，那之前塞入到缓存队列的任务怎么执行的呢？非核心线程时如何回收的呢？你有没有注意到，在 runWorker(Worker w) 中，有个循环条件。

while (task != null || (task = getTask()) != null)

当创建 Worker 时传入的 task 执行完成后，会置空。所以当 while() 再循环执行的时候， task 为 null,则往 getTask 中取。getTask 就是往缓存队列里面取任务了。

getTask

private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            //当线程池 SHUTDOWN 且 缓存队列空
            //或者线程池为 STOP 缓存队列的任务不再执行
                decrementWorkerCount(); // worker 线程跳出 while 循环结束，工作线程数量减1
                return null;
            }

            int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

            if ((wc > maximumPoolSize || (timed && timedOut))
                    && (wc > 1 || workQueue.isEmpty())) {
                    //超时回收
                if (compareAndDecrementWorkerCount(c))
                    return null;
                continue;
            }

            try {
                Runnable r = timed ?
                        workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                        workQueue.take(); //核心线程如果没有超时机制，一直阻塞
                if (r != null)
                    return r; //从缓存中取到任务
                timedOut = true; // keepAliveTime 没取到任务，超时
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

至此，整个线程池提交任务的逻辑结束完毕了。

shutDown 和 shutDowmNow

线程池的 shutDown() 和 shutDownNow() 逻辑比较简单，就是原子更新 ctl 值中的状态位。两个区别的是 shutDown() 后线程池中缓存队列的任务还会执行，shutDownNow() 则缓存队列的任务不再执行了。
需要注意的是，这两个方法只是给线程打上关闭标志，不会强行关闭线程执行。所以，在我们编写任务的 run() 方法时，当有循环执行时，最好判断下当前线程是否打上了中断标志位，并做出处理。
另一点注意的是，当缓存队列满了才会再创建非核心线程执行新任务，这时候缓存队列的任务还在等待，所以线程池中后插入的任务未必后执行。