前言
ThreadPoolExecutor是线程池的默认实现,在使用线程池的时候,如果没有特殊要求,则直接创建ThreadPoolExecutor。如果有特殊要求,则直接继承ThreadPoolExecutor,例如ScheduledThreadPoolExecutor,它是一个可以定时执行任务的线程池。
下面就通过分析ThreadPoolExecutor的源码来进一步了解线程池的原理。
源码分析
ctl
ctl意为control,是一个重要的变量,其定义如下:
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
//线程池的状态
private static final int RUNNING = -1 << COUNT_BITS; //高三位111
private static final int SHUTDOWN = 0 << COUNT_BITS; //高三位000
private static final int STOP = 1 << COUNT_BITS; //高三位001
private static final int TIDYING = 2 << COUNT_BITS; //高三位010
private static final int TERMINATED = 3 << COUNT_BITS; //高三位011
//打包和解析ctl
private static int runStateOf(int c) { return c & ~CAPACITY; }
private static int workerCountOf(int c) { return c & CAPACITY; }
private static int ctlOf(int rs, int wc) { return rs | wc; }
可以看到,ctl是一个AtomicInteger对象,它是对线程池运行状态和线程池中有效线程数量进行控制的字段。ctl有32位,其中高3位表示线程池状态,低29位表示线程池中的有效线程数。
线程池共有5种状态,分别如下:
- RUNNING:线程池初始化时的状态,此时可接受新的任务,也能处理任务队列中的任务。
- SHUTDOWN:调用shutdown方法后进入该状态,此时不再接受新的任务,但还会处理完任务队列中剩余的任务。
- STOP:调用shutdownNow方法后进入该状态,此时不再接受新的任务,也不会处理任务队列中剩余的任务。
- TIDYING:此时所有任务都已终止,workerCount为零,线程池进入该状态后将运行terminate方法并进入TIDYING状态。
- TERMINATED:terminated方法执行完毕后进入该状态。
Worker
Worker是ThreadPoolExecutor中的一个内部类,它既实现了Runnable接口,又继承了AQS,所以它既是一个可执行的任务,又是线程安全的。
private final class Worker
extends AbstractQueuedSynchronizer
implements Runnable
{
//...
final Thread thread;
Runnable firstTask;
Worker(Runnable firstTask) {
setState(-1);
this.firstTask = firstTask;
this.thread = getThreadFactory().newThread(this);
}
//...
}
它有两个重要的成员变量:thread和firstTask。thread表示用来处理当前任务的线程,firstTask保存第一次传进来的任务。
构造方法的参数
ThreadPoolExecutor的构造方法提供了一系列参数来配置线程池,其构造方法如下:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
共7个参数,各参数的含义如下:
- corePoolSize:线程池的核心线程数。默认情况下,线程池是空的,当有任务提交时才会创建线程,如果当前线程数量小于corePoolSize,则创建核心线程,核心线程会在线程池中一直存活,即使它们处于闲置状态。
- maximumPoolSize:线程池所能容纳的最大线程数,当任务队列满了但线程数未达到该值时,会创建非核心线程来执行新的任务。当任务队列满了并且线程数也达到最大值时,将执行饱和策略。
- keepAliveTime:非核心线程闲置时的超时时长,超过这个时长,非核心线程就会被回收。如果将allowCoreThreadTimeOut设置为true,那么该时长同样会作用于核心线程。
- unit:指定keepAliveTime参数的单位。
- workQueue:任务队列,如果当前线程数大于corePoolSzie,就将新的任务添加到此队列中,该队列的类型是阻塞队列。
- threadFactory:这是一个接口,用于创建线程,所有的线程都是通过该工厂来创建。
- handler:饱和策略。当线程池和任务队列都满了的时候,会调用handler的rejectedExecution方法,默认情况下该方法直接抛出异常。其他几个可选值为:用调用者所在线程执行任务、丢弃队列中靠前的任务以及丢弃当前任务。
execute(提交任务)
要想线程池提交一个任务,可以调用execute方法或submit方法,两者的区别是:execute方法只能提交任务而不能获得任务执行的结果,submit方法既能提交任务,也能获得任务执行的结果。submit方法只是先将Runnable封装为FutureTask,最终也是调用execute方法。所以直接分析execute方法:
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
int c = ctl.get(); //获取ctl的值
//如果当前有效线程数小于核心线程数
if (workerCountOf(c) < corePoolSize) {
//添加Worker执行任务(即创建一个线程执行该Runnable)
if (addWorker(command, true))
return;
//添加失败时重新获取ctl的值
c = ctl.get();
}
//如果当前有效线程数大于等于核心线程数,并且当前线程池的状态为RUNNING
//则将该任务添加至任务列表中
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
//再次检查,如果线程池的状态不是RUNNING,就将该任务从任务队列中移除,并抛出异常,拒绝该任务
if (! isRunning(recheck) && remove(command))
reject(command);
//如果发现当前的有效线程数为0,就添加一个Worker,但该Worker不执行任务
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
//执行到这里有两种情况:
//1. 线程池已经不处于RUNNING状态
//2. 线程池处于RUNNING状态,但任务队列已满
//这时再次执行addWorker,并将线程数限制设定为最大线程数,分两种情况:
//如果线程池处于RUNNING状态,并且有效线程数小于最大线程数,那么将会创建一个新的Worker来执行该任务
//如果线程池不处于RUNNING状态,或者有效线程数达到最大线程数,又或者添加Worker失败,将会执行饱和策略
else if (!addWorker(command, false))
reject(command);
}
execute方法中又用到了addWorker方法,看下该方法的实现:
addWorker
private boolean addWorker(Runnable firstTask, boolean core) {
retry:
for (;;) {
int c = ctl.get();
//获取当前线程池的状态
int rs = runStateOf(c);
//如果线程池状态为RUNNING,继续执行
//如果线程池状态为SHUTDOWN,当传入的firstTask为空且任务队列不为空时,继续执行;否则不再执行
//线程状态为STOP、TIDYING、TERMINATED时,不再执行
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
for (;;) {
//获取线程池中的有效线程数
int wc = workerCountOf(c);
//如果有效线程数大于等于限制数,不再执行
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
//使用CAS将有效线程数加1,修改成功则退出循环
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // Re-read ctl
//如果线程池状态发生改变,回到最外层循环重新开始
if (runStateOf(c) != rs)
continue retry;
}
}
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
//将firstTask包装为Worker
w = new Worker(firstTask);
//获取执行当前任务的线程
final Thread t = w.thread;
if (t != null) {
//操作Worker前需先加锁
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
int rs = runStateOf(ctl.get());
//当线程池的状态是RUNNING时,执行任务
//当线程池的状态是SHUTDOWN并且firstTask为空时,执行任务
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
//将当前Worker添加进HashSet中
workers.add(w);
//更新当前最大有效线程数
int s = workers.size();
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
//Worker已添加进集合时,启动线程执行任务
if (workerAdded) {
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
addWorker方法的执行步骤如下:
- 首先根据当前线程池的状态判断是否要执行添加Worker的操作:
- 如果线程池状态为RUNNING,继续执行
- 如果线程池状态为SHUTDOWN,当传入的firstTask为空且任务队列不为空时,继续执行;否则不再执行
- 线程状态为STOP、TIDYING、TERMINATED时,不再执行
- 如果有效线程数大于等于限制数,不再执行。否则将ctl的有效线程数加1。
- 根据传入的firstTask创建Worker对象,然后将该Worker对象添加进HashSet中保存起来,由于HashSet是非线程安全的,所以该过程需要加锁。之后在添加前还要再判断一次,如果线程池的状态是RUNNING或者线程池的状态是SHUTDOWN并且firstTask为空时,就将Worker添加进HashSet中。
- 最后还要判断Worker是否启动成功,启动成功返回true,否则就要将ctl的有效线程数减1,并且从HashSet中删除该Worker对象。
小结下execute的步骤
- 如果当前有效线程数小于核心线程数,就通过addWorker方法来执行任务,在addWorker方法中,如果线程池状态和当前线程数没问题,就会创建并启动线程来执行任务。
- 如果当前有效线程数大于等于核心线程数,线程池的状态为RUNNING,且任务队列未满的话,就将任务添加至任务列表中。添加完后要再次检查:如果线程池的状态已经不是RUNNING,就将该任务从任务队列中移除,并执行饱和策略。如果发现线程池还是RUNNING状态但线程池中没有有效线程,就通过addWorker开启一个新线程来执行任务。
- 如果线程池已经不处于RUNNING状态或者线程池处于RUNNING状态,但任务队列已满。就再次执行addWorker,并将限制数设为最大线程数,这时分两种情况:如果线程池处于RUNNING状态,并且有效线程数小于最大线程数,那么将会创建一个新的Worker来执行该任务;如果线程池不处于RUNNING状态,或者有效线程数达到最大线程数,又或者是添加Worker失败,就会执行饱和策略。
其流程图如下:
执行任务
在addWorker方法中,要执行任务时,调用以下代码:
if (workerAdded) {
t.start();
workerStarted = true;
}
其中,t为w.thread,即Worker中的thread变量,其创建如下:
Worker(Runnable firstTask) {
//...
this.thread = getThreadFactory().newThread(this);
}
getThreadFactory()默认返回Executors.defaultThreadFactory,其newThread方法如下:
public Thread newThread(Runnable r) {
Thread t = new Thread(group, r,
namePrefix + threadNumber.getAndIncrement(),
0);
if (t.isDaemon())
t.setDaemon(false);
if (t.getPriority() != Thread.NORM_PRIORITY)
t.setPriority(Thread.NORM_PRIORITY);
return t;
}
可以看到,Worker作为target创建了Thread,所以调用t.start的时候就是调用了Worker的run方法:
public void run() {
runWorker(this);
}
可以看到,真正执行任务的方法是runWorker:
runWorker
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
//先执行Worker的firstTask,之后再不断地尝试从任务队列中取出任务来执行
while (task != null || (task = getTask()) != null) {
//执行任务前先加锁,避免同一个任务被多个线程执行
w.lock();
//如果线程池正在停止,需确保中断当前线程
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
//回调该方法,执行任务前可以做一些操作
beforeExecute(wt, task);
Throwable thrown = null;
try {
//真正开始执行任务
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
//回调该方法,执行任何后可以做一些操作
afterExecute(task, thrown);
}
} finally {
//置空task,新的task通过getTask方法从任务队列中获取
task = null;
//记录该Worker执行了多少次任务
w.completedTasks++;
w.unlock();
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
在runWorker方法中用到了getTask方法,该方法不断地尝试从任务队列中取出任务,实现如下:
getTask
private Runnable getTask() {
//超时标记,如果上一次调用任务队列的poll方法超时,就会标记为true
boolean timedOut = false;
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
//如果线程池状态为SHUTDOWN且任务队列为空,或者线程池状态为大于等于STOP,则执行下面操作:
//将当前有效线程数减一并返回null,这时该线程因得不到任务而销毁
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
//默认情况下,当有效线程数小于等于核心线程数时,该值为false
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
//以下情况要销毁线程:
//1. 有效线程数大于最大线程数
//2. 有效线程数大于核心线程数或核心线程数也可回收,且上一次调用任务队列的poll方法超时
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
//若当前有效线程数小于等于核心线程数,则从任务队列中阻塞获取任务
//否则阻塞超时获取任务,如果获取任务超时且下次循环时有效线程数大于核心线程数,就销毁当前线程
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
//成功获取到任务时返回该任务
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
小结下执行任务的步骤
真正执行任务的入口是runWorker方法,在该方法中:
- 先执行Worker的firstTask,之后再不断地尝试从任务队列中取出任务来执行
- 执行任务前需先加锁,避免同一个任务被多个线程执行。还有判断线程池的状态,如果线程池正在停止,需中断当前线程。
- 调用Runnable的run方法,真正执行任务。执行完任务后置空task,新的task通过getTask方法从任务队列中获取。
getTask的执行步骤如下:
- 先根据线程池状态判断是否要销毁当前线程:如果线程池状态为SHUTDOWN且任务队列为空,或者线程池状态为大于等于STOP,就将当前有效线程数减一并返回null,这时当前线程因得不到任务而销毁
- 再根据有效线程数判断是否要销毁当前线程,以下两种情况要销毁线程:1. 有效线程数大于最大线程数。 2. 有效线程数大于核心线程数或核心线程数也可回收,且上一次调用任务队列的poll方法超时
- 获取任务:若当前有效线程数小于等于核心线程数并且核心线程不可回收时,就从任务队列中阻塞获取任务,如果一直获取不到任务就会一直阻塞在这里,这就保证了核心线程不会被销毁。若当前有效线程数大于核心线程数或者核心线程可回收时,就阻塞超时获取任务,如果获取任务超时且下次循环时有效线程数还是大于核心线程数,就销毁当前线程。