线程池ThreadPoolExecutor原理

最新推荐文章于 2023-09-04 11:42:33 发布

reachwang

最新推荐文章于 2023-09-04 11:42:33 发布

阅读量163

点赞数

分类专栏： java多线程文章标签：线程池

本文链接：https://blog.csdn.net/reachwang/article/details/100848026

版权

java多线程专栏收录该内容

12 篇文章 1 订阅

订阅专栏

线程池的出现为了解决两个问题：一是性能问题。因为线程的创建和销毁都是需要开销的，所以可以复用线程池里的线程，从而不需要每次执行异步任务都重新创建和销毁线程。二是线程池提供了一种资源限制和管理的手段，比如可限制线程个数或动态增加线程等。

Executor的工厂方法提供了许多种线程池（静态方法），从而满足不同需求，比如newCachedThreadPool（线程池线程个数最多可达Integer.MAX_VALUE，线程自动回收）、newFixedThreadPool（固定大小的线程池）和newSingleThreadExecutor（单个线程）等来创建线程池。

1.ThreadPoolExecutor类解析

首先说一下里面的一个Integer的原子变量ctl，它用来同时记录线程池状态和线程池中线程个数：其中高3位用来表示线程池状态，后面29位用来记录线程池线程个数（假设int为32位）。线程池状态有多个，当然它们对应的值可以去源码里寻找，无非就是针对高三位有不同设置，主要说一下各状态的含义（数值是从小到大排列的）：

RUNNING：接受新任务并且处理阻塞队列里的任务。
SHUTDOWN：拒绝新任务但是处理阻塞队列里的任务。
STOP：拒绝新任务并且抛弃阻塞队列里的任务，同时中断正在处理的任务。
TIDYING：所有任务都执行完（包括阻塞队列里的任务）后当前线程池活动线程数为0，将要调用terminated方法。
TERMINATED：终止状态。terminated方法调用完以后的状态。

线程池就是在这几种状态之间不停的转换，其转换图如下：
在这里插入图片描述

线程参数

线程池有各种各样的参数，如下：

corePoolSize：线程池核心线程个数。
workQueue：用于保存等待执行的任务的阻塞队列，比如基于数组的有界ArrayBlockingQueue、基于链表的无界LinkedBlockingQueue、最多只有一个元素的同步队列SynchronousQueue和优先级队列PriorityBlockingQueue等。
maximunPoolSize:线程池最大线程数量。
ThreadFactory：创建线程的工厂。
RejectedExecutionHandler：饱和策略，队列满且线程个数达到maximunPoolSize后采取的策略，如AbortPolicy（抛出异常）、CallerRunsPolicy（使用调用者所在线程运行任务）、DiscardOldestPolicy（调用poll丢弃一个任务，执行当前任务）及DiscardPolicy（默认丢弃，不抛出异常）
keepAliveTime：存活时间。若当前线程池中的线程数量比核心线程数量多，并且是闲置状态，则这些闲置的线程能存活的最大时间。也就是把超过核心线程数量的线程看成是“多余”的，要设一个过期日期。
TimeUnit：存活时间的时间单位。

线程池类型

newFIxedThreadPool：创建一个核心线程个数和最大线程个数都为nThreads的线程池，并且阻塞队列长度为Integer.MAX_VALUE。keepAliveTime=0说明只要线程个数比核心线程个数多并且当前空闲则回收。

    public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }
	//使用自定义线程创建工厂
    public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>(),
                                      threadFactory);

newSingleThreadExecutor：创建一个核心线程个数和最大线程个数都为1的线程池，并且阻塞队列长度为Integer.MAX_VALUE。keepAliveTime=0说明只要线程个数比核心线程个数多并且当前空闲则回收。

    public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>()));
    }

    public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory) {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>(),
                                    threadFactory));
    }

newCachedThreadPool：创建一个按需创建线程的线程池，初始线程个数为0，最多线程个数为Integer.MAX_VALUE。并且阻塞队列为同步队列。keepAliveTime=60说明只要当前线程在60s内空闲则回收。这个类型特殊之处在于：加入同步队列的任务会被马上执行，同步队列里面最多只有一个任务。

    public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }
 
     public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory) {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>(),
                                      threadFactory);
    }

同时有一个变量mainLock是独占锁，用来控制新增Worker线程操作的原子性。termination是该锁对应的条件队列，在线程调用awaitTermination时，用来存放阻塞的线程。

Worker集成AQS和Runnable接口，是具体承载任务的对象。Worker继承了AQS，自己实现了简单不可重入独占锁，其中state=0表示锁未被获取状态，state=1表示锁已经被获取的状态，state=-1是创建Worker时默认的状态，创建时设置为-1是为了避免该线程在运行runWorker()方法前被中断。后面会具体讲到Worker类

2.ThreadPoolExecutor代码解析

2.1 execute(Runnable command)方法

这个方法就是将一个任务放入到线程池中，它主要包括4个步骤：

如果当前运行线程少于corePoolSize，则创建新线程执行任务（这一步需要获取全局锁）。
如果运行的线程等于或多于corePoolSize，则将任务加入BlockingQueue。
如果无法将任务加入BlockingQueue（队列已满），则创建新的线程来处理任务（也需要获取全局锁）
若创建新线程将使得当前线程数超过maximunPoolSIze，任务被拒绝并调用RejectedExecutionHandler.rejectedExecution()方法

代码如下：

public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get();
        //1.如果当前运行的线程少于corePoolSize，则开启新线程运行
        if (workerCountOf(c) < corePoolSize) {	
            if (addWorker(command, true))
                return;
            c = ctl.get();		//添加失败重新获取一次线程池状态
        }
        //2.否则如果线程池处于RUNNING状态，则添加到任务阻塞队列中
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            //3.若添加后线程池状态不是RUNNING，则是要抛弃新任务的，所以删除此任务并执行拒绝策略
            if (! isRunning(recheck) && remove(command))
                reject(command);
             //4.如果当前线程池为空，则添加一个线程来处理阻塞队列中的任务
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        //5.如果队列也满了，则新增线程，新增失败则执行拒绝策略
        else if (!addWorker(command, false))
            reject(command);
    }

2.2 addWorker(Runnable firstTask, boolean core)方法

接下来再看一下新增线程的addWorker方法，代码如下：

    private boolean addWorker(Runnable firstTask, boolean core) {
        retry:
        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // 1.检查队列为空是不是只是因为没有任务了
            if (rs >= SHUTDOWN &&
                ! (rs == SHUTDOWN &&
                   firstTask == null &&
                   ! workQueue.isEmpty()))
                return false;
			//2.循环CAS增加线程个数
            for (;;) {
                int wc = workerCountOf(c);
                if (wc >= CAPACITY ||
                    wc >= (core ? corePoolSize : maximumPoolSize))
                    return false;
                 // 2.1 CAS增加线程个数，同时只有一个线程成功，成功直接退出循环
                if (compareAndIncrementWorkerCount(c))
                    break retry;
                 // 2.2 CAS失败则重新获取状态，若状态变了则从外部循环重新开始，否则直接在内层循环中进行CAS
                c = ctl.get();  // Re-read ctl
                if (runStateOf(c) != rs)
                    continue retry;
                // else CAS failed due to workerCount change; retry inner loop
            }
        }
		// 3. CAS 成功了，即数量参数更新成功
        boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
        	// 3.1 创建一个新的worker（线程池的基本单位）
            w = new Worker(firstTask);
            final Thread t = w.thread;
            if (t != null) {
                final ReentrantLock mainLock = this.mainLock;
                //3.2 加锁，保证添加worker时的原子性，即只有一个线程能将新建的线程加到池中
                mainLock.lock();
                try {
                    // Recheck while holding lock.
                    // Back out on ThreadFactory failure or if
                    // shut down before lock acquired.
                    int rs = runStateOf(ctl.get());
					//3.3 检查队列为空只是因为没有任务了
                    if (rs < SHUTDOWN ||
                        (rs == SHUTDOWN && firstTask == null)) {
                        if (t.isAlive()) // precheck that t is startable
                            throw new IllegalThreadStateException();
                         // 3.4 添加任务
                        workers.add(w);
                        int s = workers.size();
                        if (s > largestPoolSize)
                            largestPoolSize = s;
                        workerAdded = true;
                    }
                } finally {
                    mainLock.unlock();
                }
                // 3.5 添加成功后则启动任务
                if (workerAdded) {
                    t.start();
                    workerStarted = true;
                }
            }
        } finally {
            if (! workerStarted)
                addWorkerFailed(w);
        }
        return workerStarted;
    }

代码比较长。首先我们要知道的就是所谓的线程池，里面包含的线程就是这些Worker。上面的代码主要分为两部分：第一部分的大的for循环就是用来原子改变workerCount的，第二部分则是新建Worker，并将它加入到池中（workers，它是一个HashSet）。添加以后就会执行3.5处的start()，这会启动这个worker，让其不断地获取自己里面的firstTask，或者从阻塞队列中取task，这个在后面讲。

这个地方我们看一下代码1和3.3两处，两者类似。3.3处几乎相当于1处相反的情况，或者说3.3处的更容易理解一些。就是检查线程池是不是正处于运行状态（此时可以添加新线程）或者线程池处于shutdown状态，但是是因为没有能执行的线程了（firstTask == null）并且阻塞队列里还有任务（! worker.isEmpty()），那么此时也可以添加一个新的线程。

当然也可以对代码1进行等价运算，展开后半部分的！则会有三种情况使得添加过程返回false，如下：

s >= SHUTDOWN &&
	(rs != SHUTDOWN ||  //(1)当前线程池状态为STOP、TIDYING或TERMINATED
	firstTask != null ||  //(2)当前线程池状态为SHUTDOWN并且已经有了第一个任务（能执行任务的线程）
	workQueue.isEmpty())  //(3)当前线程池状态为SHUTDOWN并且任务队列为空

所以总体来说就两部分：改变workerCount和创建新worker并启动。

2.3 Worker类

首先我们先看一下所谓的线程池中的基本单位，即Worker类，它的定义及构造函数如下：

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
    {
        ...

        final Thread thread;

        Runnable firstTask;

        volatile long completedTasks;
      
        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            // 将当前对象作为参数传到它的thread变量中，这样在执行thread的start方法时，便执行worker的run方法。
            this.thread = getThreadFactory().newThread(this);
        }

        //将执行的过程交给外部方法来处理
        public void run() {
            runWorker(this);
        }
        
        ...
    }

里面有一个thread变量，这个变量便存放了真正去执行任务的线程。还有一个task表示这个worker当前正在执行的任务。特别要注意的是构造函数的第三行，它将自己作为对象传到了thread变量的构造中，这样在执行worker.thread.start()方法时，其实就是执行了worker.run()方法，进而调用了外部的runWorker方法。这也就对应了上一小节中addWorker方法里面3.4处调用的是worker.thread.start()方法来启动这个worker。

2.4 runWorker(Worker w)方法

runWorker(Worker w)方法通过将当前自己（某个worker）作为参数传进去来启动自己worker的工作流程，让这个worker不停地检查自己的task或者从阻塞队列中取task。runWorker方法如下：

    final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();		//获取当前线程，方便它中断worker的执行
        Runnable task = w.firstTask;
        w.firstTask = null;		//设置为空后方便它从阻塞队列中取后续的任务并进行赋值
        w.unlock(); 			// 允许中断
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();			//1. 开始任务前要加锁
                ...
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);			//2. 执行前做的事
                    Throwable thrown = null;
                    try {
                        task.run();						//3. 真正执行任务
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);			//4. 执行后做的一些事
                    }
                } finally {
                    task = null;
                    w.completedTasks++;	//这个线程所做的工作数量加1
                    w.unlock();		//5. 执行完毕后统计当前worker完成任务数释放锁
                }
            }
            completedAbruptly = false;
        } finally {			//6.这个worker取不到task了，执行自身的清理工作
            processWorkerExit(w, completedAbruptly);
        }
    }

这里在执行任务期间加锁，是为了避免在任务运行期间，其他线程调用了shutdown后正在执行的任务被中断，所以为了执行期间运行下去，不响应中断。

代码6执行清理工作，即将自己这个worker删除，并把完成的任务数量加到线程池的总数量上，代码如下：

    private void processWorkerExit(Worker w, boolean completedAbruptly) {
        if (completedAbruptly) // 如果某一个worker在执行while的时候突然中断，则worker数减1
            decrementWorkerCount();
            
		//加全局锁保证原子更新（删除）workers
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
       	 	//1. 统计线程池完成任务个数，加到全局计数器中，并删除当前这个worker
            completedTaskCount += w.completedTasks;		
            workers.remove(w);
        } finally {
            mainLock.unlock();
        }
		//2. 尝试设置线程池状态为TERMINATED，如果当前是SHUTDOWN状态且工作队列为空
		//或者当前是STOP状态，且线程池里没有活动线程
        tryTerminate();

		//3.如果当前线程个数小于核心个数，则增加
        int c = ctl.get();
        if (runStateLessThan(c, STOP)) {
            if (!completedAbruptly) {
                int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
                if (min == 0 && ! workQueue.isEmpty())
                    min = 1;
                if (workerCountOf(c) >= min)
                    return; // 正在工作的线程数是大于corlPoolSize，则无需添加新线程，直接返回
            }
            addWorker(null, false);
        }
    }

存在这个清理工作时因为当前这个worker（线程）获取不到task了，那么它就认为没有任务了，所以会做一些统计工作，并尝试改变线程池的状态。当然，设置线程池状态为TERMINATED后，则还需要调用条件变量termination的signalAll()方法激活所有因为调用线程池的awaitTermination方法而被阻塞的线程。

2.5 shutdown操作

调用shutdown方法后，线程池就不会再接受新的任务了，但是工作队列里面的任务还是要执行。该方法会立刻返回，并不等待队列任务完成再返回。以下是其代码：

    public void shutdown() {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            checkShutdownAccess();		//1. 权限检查
            advanceRunState(SHUTDOWN);		//2. 设置当前线程状态为shutdown
            interruptIdleWorkers();			//3. 设置中断标志
            onShutdown(); // hook for ScheduledThreadPoolExecutor
        } finally {
            mainLock.unlock();
        }
        //4.尝试将线程池状态改变为TERMINATED
        tryTerminate();
    }

其中主要是代码3部分，做了以下事：设置所有空闲线程的中断标志。首先加了全局锁，同时只能有一个线程可以调用shutdown方法。然后尝试获取所有Wokers中自己的锁，获取成功则设置中断标志。若正在执行任务的worker已经获取了自己的锁，则不会被中断。这里中断的是阻塞到getTask()方法并试图从队列里面获取任务的线程，也就是空闲线程。代码如下：

    private void interruptIdleWorkers(boolean onlyOne) {
        final ReentrantLock mainLock = this.mainLock;		//先加全局锁，保证只有一个线程能中断线程池
        mainLock.lock();
        try {
            for (Worker w : workers) {
                Thread t = w.thread;
                //没有中断且不在执行任务（能获取锁说明没在执行）
                if (!t.isInterrupted() && w.tryLock()) {		
                    try {
                        t.interrupt();			//设置中断标志
                    } catch (SecurityException ignore) {
                    } finally {
                        w.unlock();
                    }
                }
                //它为true，则最多只会中断一个worker，甚至有可能没有中断任何worker，不能保证上面的if一定执行
                if (onlyOne)	
                    break;
            }
        } finally {
            mainLock.unlock();
        }
    }

    final void tryTerminate() {
        for (;;) {
            int c = ctl.get();
            ...

            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {		//设置当前线程池状态为TIDYING
                    try {
                        terminated();	//默认什么都不做，可能子类会用到
                    } finally {
                        ctl.set(ctlOf(TERMINATED, 0));		//设置当前线程状态为TERMINATED
                        termination.signalAll();	//激活因调用条件变量termination的await系列方法而被阻塞的所有线程
                    }
                    return;
                }
            } finally {
                mainLock.unlock();
            }
            // 不断的进行cas重试上述过程，知道成功
        }
    }

在如上代码中，首先使用CAS设置当前线程池状态为TIDYING，如果设置成功则执行扩展接口terminated在线程池状态变为TERMINATED前做一些事情，然后设置当前线程池状态为TERMINATED。最后调用termination.signalALL()激活因条件变量termination的await系列方法而被阻塞的所有线程。后面awaitTermination方法会讲到。

2.6 shutdownNow操作

调用shutdownNow方法后，线程池就不会再接受新的任务了，且会丢弃工作队列里面的任务，正在执行的任务会被中断，该方法会立刻返回，并不等待激活的任务执行完成。返回值为这时候队列里面被丢弃的任务列表。

    public List<Runnable> shutdownNow() {
        List<Runnable> tasks;
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            checkShutdownAccess();		//1. 检查权限
            advanceRunState(STOP);		//2. 设置线程池状态为STOP
            interruptWorkers();			//3. 中断所有线程，这一步是主要操作
            tasks = drainQueue();		//4.将当前任务队列里的任务移动到tasks列表
        } finally {
            mainLock.unlock();
        }
        tryTerminate();
        return tasks;
    }

    private void interruptWorkers() {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            for (Worker w : workers)
                w.interruptIfStarted();	
        } finally {
            mainLock.unlock();
        }
    }
    
private final class Worker
    extends AbstractQueuedSynchronizer
    implements Runnable {
    	...
        void interruptIfStarted() {
            Thread t;
            if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                }
            }
        }
    }

要知道代码3会中断的所有线程包括空闲线程和正在执行任务的线程。

2.7 awaitTermination操作

当线程调用awaitTermination方法后，当前线程会被阻塞，直到线程池状态变为TERMINATED才返回，或者等待时间超时才返回。代码如下：

    public boolean awaitTermination(long timeout, TimeUnit unit)
        throws InterruptedException {
        long nanos = unit.toNanos(timeout);
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();			//进行判断的时候要加上独占锁
        try {
            for (;;) {
                if (runStateAtLeast(ctl.get(), TERMINATED))		//1. 变为了TERMINATED，返回true
                    return true;
                if (nanos <= 0)			//2. 超时了，返回
                    return false;
                nanos = termination.awaitNanos(nanos);			//3. 否则说明还有线程在执行等待unit秒
            }
        } finally {
            mainLock.unlock();
        }
    }