前阵子在用C++ 98(是比较落后了,嗯,C++11原生支持Future)开发的时候,对脱离业务的公共逻辑抽象出来了一个简单的任务执行框架,里面主要是线程池和一些同步异步的任务。在开发异步任务的时候,为了实现类似java Future模式的能力,对实现方式考量了好久,最终使用了信号量这么重的东西来实现了Future的能力,同时也不禁对java的Future实现产生兴趣,java的Future是怎么实现的呢?
concurrent 包
java Future相关的代码基本都在java.util.concurrent的包里面,Future.java是一个接口,定义了最基本的一些任务操作和状态判断。
// Future.java
boolean cancel(boolean mayInterruptIfRunning);
boolean isCancelled();
boolean isDone();
V get() throws InterruptedException, ExecutionException;
V get(long timeout, TimeUnit unit);
我们从FutureTask.java去了解Future的内部机制,FutureTask对Future有比较接地气的实现,其他的实现或多或少都加入了新的一些特性,对了解原理没太大帮助。
FutureTask.java是对Futre和Runnable最简单的实现,所以FutureTask是一个可执行的异步对象。
FutureTask的状态
FutureTask定义了7种状态,这7种状态里面包含了简单的状态机,使用了一个用volatile修饰的int来记录状态。如下:
/** Possible state transitions:
* NEW -> COMPLETING -> NORMAL
* NEW -> COMPLETING -> EXCEPTIONAL
* NEW -> CANCELLED
* NEW -> INTERRUPTING -> INTERRUPTED
*/
private volatile int state;
private static final int NEW = 0;
private static final int COMPLETING = 1;
private static final int NORMAL = 2;
private static final int EXCEPTIONAL = 3;
private static final int CANCELLED = 4;
private static final int INTERRUPTING = 5;
private static final int INTERRUPTED = 6;
状态的变换基本在FutureTask.java的所有函数中都有体现,我们来看看几个典型的状态变换:
构造函数
构造函数完成时,将状态置为NEW
取消操作
取消操作对任务状态进行判断。
如果任务正在执行但没有完成时,发出中断,并将任务状态置为中断中状态,并在执行线程完成后,置为中断完成状态NEW -> INTERRUPTING -> INTERRUPTED
当任务还没有执行,则直接置为取消状态 NEW -> CANCELLED
执行操作
执行分执行成功和执行异常两种,状态转换路径是这两个。
NEW -> COMPLETING -> NORMAL和NEW -> COMPLETING -> EXCEPTIONAL
FutureTask的执行
FutureTask因为封装了Runnable的接口,实现了run函数,所以可以直接执行,直接执行使用主线程;FutureTask的另外一种执行方式是提交到线程池去执行,由线程池去分配执行线程;只有提交到线程池去执行才能体现异步的特性。不过我们不关注执行的方式,我们关注执行的逻辑。
FutureTask的构造函数传入了Callable或Runnable对象,也即是需要执行的业务逻辑,他是业务逻辑的基本表现形式,保存在类属性callable,在run函数里面,调用callalbe.call()来执行业务逻辑。run函数主要完成以下几个操作。
判断当前状态是否为NEW,如果不是,说明任务被执行过,或者已被取消,直接返回。
如果状态为NEW,接着会通过unsafe类把任务执行线程保存在runner字段中,如果保存失败,则直接返回。
执行任务
任务执行成功,set保存结果,不成功setException保存异常信息,任务的状态在这里改变。
以下是run函数的逻辑。
public void run() {
if (state != NEW ||
!UNSAFE.compareAndSwapObject(this, runnerOffset,
null, Thread.currentThread())) // 1, 2
return;
try {
Callable c = callable;
if (c != null && state == NEW) {
V result;
boolean ran;
try {
result = c.call(); // 3
ran = true;
} catch (Throwable ex) {
result = null;
ran = false;
setException(ex); // 4
}
if (ran)
set(result); // 4
}
} finally {
// runner must be non-null until state is settled to
// prevent concurrent calls to run()
runner = null;
// state must be re-read after nulling runner to prevent
// leaked interrupts
int s = state;
if (s >= INTERRUPTING)
handlePossibleCancellationInterrupt(s);
}
}
由于在任务执行的过程中,可能被取消,所以在finally块里,会任务的根据状态来做一些善后的工作。
FutureTask的取消
任务的取消比较简单,我们知道,在执行的时候,执行任务的线程会保存在runner属性中,所以对于正在执行的任务,取消的本质就是将执行的线程取出来,向该线程发出interupt信号。但对于一个较为完备的取消动作,cancel做了一下几个动作。
判断任务当前执行状态,如果任务状态不为NEW,则说明任务或者已经执行完成,或者执行异常,不能被取消,直接返回false表示执行失败。
判断需要中断任务执行线程,则
把任务状态从NEW转化到INTERRUPTING。这是个中间状态。
中断任务执行线程。
修改任务状态为INTERRUPTED。
如果不需要中断任务执行线程,直接把任务状态从NEW转化为CANCELLED。如果转化失败则返回false表示取消失败。
调用finishCompletion
这个函数将阻塞在等待这个任务完成的线程唤醒,具体操作是LockSupport.unpark(t),这些线程都是在awaitDone函数内的LockSupport.park(this)中阻塞的,关于awaitDone函数的作用后文还会继续介绍。finishCompletion除了在这里有调用以外,在set和setException中也有调用。
以下是finishCompletion的实现
/**
* Removes and signals all waiting threads, invokes done(), and
* nulls out callable.
*/
private void finishCompletion() {
// assert state > COMPLETING;
for (WaitNode q; (q = waiters) != null;) {
if (UNSAFE.compareAndSwapObject(this, waitersOffset, q, null)) {
for (;;) {
Thread t = q.thread;
if (t != null) {
q.thread = null;
LockSupport.unpark(t);
}
WaitNode next = q.next;
if (next == null)
break;
q.next = null; // unlink to help gc
q = next;
}
break;
}
}
done();
callable = null; // to reduce footprint
}
以下是cancel函数的实现。
public boolean cancel(boolean mayInterruptIfRunning) {
if (!(state == NEW &&
UNSAFE.compareAndSwapInt(this, stateOffset, NEW,
mayInterruptIfRunning ? INTERRUPTING : CANCELLED))) // 1, 2
return false;
try { // in case call to interrupt throws exception
if (mayInterruptIfRunning) {
try {
Thread t = runner;
if (t != null)
t.interrupt();
} finally { // final state
UNSAFE.putOrderedInt(this, stateOffset, INTERRUPTED); // 3
}
}
} finally {
finishCompletion(); // 4
}
return true;
}
FutureTask的结果
异步任务提交到线程池去执行后,由于无法预知什么时候结束,所以必须得提供接口来获取任务执行的结果,在FutureTask中,get函数用来获取任务执行的结果。该函数有了设置超时和不超时的两种实现。
除去超时的差异,get操作对任务的状态进行判断,当状态还没有完成的时候,调用awaitDone函数来等待完成,我们在上面提到过这个函数,对于未完成的任务awaitDone阻塞,而finishCompletion唤醒阻塞。
public V get() throws InterruptedException, ExecutionException {
int s = state;
if (s <= COMPLETING)
s = awaitDone(false, 0L);
return report(s);
}
我们来详细看看awaitDone函数做了什么操作,它是如何阻塞的,它是怎么设置超时和完成返回的。
awaitDone主题是一个死循环,轮询判断任务的状态。
当执行的线程被中断时,调用removeWaiter移除等待节点WaitNode,抛出中断异常
当状态为已经完成,直接返回
当状态为完成中,通过Thread.yield()让出CPU时间
如果当前线程还没有创建WaitNode等待节点保存到等待队列里面去,则新建一个等待节点,插入到等待链表,表明当前线程也准备进入等待该任务完成的队列中去。
最后是进入阻塞的动作,通过LockSupport.park,如果设置了超时的时间,则将时间作为参数传递到park中去。
综上,awaitDone函数除了对状态的判断以外,核心就是LockSupport的阻塞等待完成的操作了。我们后面还会探讨一下LockSupport。
private int awaitDone(boolean timed, long nanos)
throws InterruptedException {
final long deadline = timed ? System.nanoTime() + nanos : 0L;
WaitNode q = null;
boolean queued = false;
for (;;) {
if (Thread.interrupted()) {
removeWaiter(q);
throw new InterruptedException();
}
int s = state;
if (s > COMPLETING) {
if (q != null)
q.thread = null;
return s;
}
else if (s == COMPLETING) // cannot time out yet
Thread.yield();
else if (q == null)
q = new WaitNode();
else if (!queued)
queued = UNSAFE.compareAndSwapObject(this, waitersOffset,
q.next = waiters, q);
else if (timed) {
nanos = deadline - System.nanoTime();
if (nanos <= 0L) {
removeWaiter(q);
return state;
}
LockSupport.parkNanos(this, nanos);
}
else
LockSupport.park(this);
}
}
当awaitDone的阻塞完成以后,就会将结果返回,将结果返回是通过report函数来实现的,返回的是执行完成的结果或者是执行中获得的异常信息。
LockSupport
异步执行任务,在获取任务状态时,阻塞是必然的,在开头引子我简单的提到了在自己实现的那个简陋的框架内,使用了信号量的方式来设置异步任务的阻塞和执行状态。在这里是通过LockSupport来实现的,阻塞(park)和唤醒(unpark)。
public static void unpark(Thread thread) {
if (thread != null)
UNSAFE.unpark(thread);
}
public static void park(Object blocker) {
Thread t = Thread.currentThread();
setBlocker(t, blocker);
UNSAFE.park(false, 0L);
setBlocker(t, null);
}
可以看到LockSupport则是通过UNSAFE的同名函数来实现的。java不能直接访问操作系统底层,而是通过本地方法来访问。Unsafe类提供了硬件级别的原子操作。
Unsafe类是在sun.misc包下,不属于java标准。但是很多Java的基础类库,包括一些被广泛使用的高性能开发库都是基于Unsafe类开发的,比如Netty、Cassandra、Hadoop、Kafka等。Unsafe类在提升Java运行效率,增强Java语言底层操作能力方面起了很大的作用。Unsafe类使Java拥有了像C语言的指针一样操作内存空间的能力,同时也带来了指针的问题。过度的使用Unsafe类会使得出错的几率变大,因此Java官方并不建议使用的,官方文档也几乎没有。
所以在这里java也是使用了C级别的线程同步机制来完成这些操作的,在这就不再展开了。
为保持文章内容的连贯性,部分内容参考自: