手撕AQS之Condition

Condition 的使用接触最多是在 ReentrantLock,讲 AQS 到这里应该就完结了,前两篇文章理了下 AQS 的共享锁模式和独立锁模式,这篇在理下其中 Condition 的原理。


我在第一篇 手撕AQS之共享锁 有提到同步操作的本质,大概遵循以下流程:

  1. 持有锁;
  2. 操作共享资源;
  3. 释放锁;

无论是使用共享或者独占锁,都无法在持有锁的中途将锁让出,并继续等待着获取锁。这就像使用 synchronized 同步对象一样,但 synchronized 可以利用被同步对象的 wait 方法让出锁,当该对象的 notify 被调用时,它又能重新竞争锁。所以,使用 ReentrantLock 怎样实现这个呢?AQS 中实现了 Condition 接口的 ConditionObject 类能够帮助我们做到。

整体思想ConditionObject 维护了条件队列,当调用 await 时,将创建 node 并加入该条件队列,当 signal 时,node 会从条件队列取出,加入 CLH 队列(这在前两篇文章中有讲),这和之前的逻辑并无两样。那现在,我们来看看关键的 await 和 signal 。

await:

		public final void await() throws InterruptedException {
            // 首先检查线程是否中断
            if (Thread.interrupted())
                throw new InterruptedException();
            // 创建 node 节点,添加到队尾
            Node node = addConditionWaiter();
            // 1.释放状态值,并保存曾持有的状态值
            int savedState = fullyRelease(node);
            int interruptMode = 0;
            // 2.该节点不处于非同步队列,暂停线程
            while (!isOnSyncQueue(node)) {
                LockSupport.park(this);
                if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
                    break;
            }
            // 3.请求入CLH 队列
            if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
                interruptMode = REINTERRUPT;
            if (node.nextWaiter != null) // clean up if cancelled
                unlinkCancelledWaiters();
            if (interruptMode != 0)
                reportInterruptAfterWait(interruptMode);
        }
  1. 释放状态值,并保存曾持有的状态值,目的是为了在重新获得锁后,恢复曾持有的状态值:

    	final int fullyRelease(Node node) {
            boolean failed = true;
            try {
                int savedState = getState();
                // 真正的释放锁,会在方法内调用子类的实现
                if (release(savedState)) {
                    failed = false;
                    return savedState;
                } else {
                    // 这就是为什么调用 await 方法必须要获取到锁的原因
                    throw new IllegalMonitorStateException();
                }
            } finally {
                // 失败的话,通过该状态值,该节点能够从队列中移除
                if (failed)
                    node.waitStatus = Node.CANCELLED;
            }
        }
    
  2. 该节点不处于同步队列(CLH 队列),暂停线程:

    	final boolean isOnSyncQueue(Node node) {
            // 还是属于条件队列(prev可以是非空的,但不足以判断其在队列上,因为把它放在队列上的CAS可能会失败。)
            if (node.waitStatus == Node.CONDITION || node.prev == null)
                return false;
            // 进入同步队列,会为该成员赋值,条件队列是通过 `nextWaiter` 成员维护的
            if (node.next != null) // If has successor, it must be on queue
                return true;
            // 能到这里,这个节点基本在队列尾部
            return findNodeFromTail(node);
        }
    
    	// 从同步队列循环查找该节点,如果存在,则返回 true
    	private boolean findNodeFromTail(Node node) {
            Node t = tail;
            for (;;) {
                if (t == node)
                    return true;
                if (t == null)
                    return false;
                t = t.prev;
            }
        }
    
  3. 请求入CLH 队列,这就和 手撕AQS之独占锁模式 中的一样了。

signal:

		public final void signal() {
            // 调用该方法的线程必须持有锁
            if (!isHeldExclusively())
                throw new IllegalMonitorStateException();
            // 通知等待最长的节点
            Node first = firstWaiter;
            if (first != null)
                doSignal(first);
        }
		private void doSignal(Node first) {
            do {
                // 从队列中移除该节点,并将它的下一节点放置队头
                if ( (firstWaiter = first.nextWaiter) == null)
                    lastWaiter = null;
                first.nextWaiter = null;
            } while (!transferForSignal(first) &&
                     (first = firstWaiter) != null);
        }

transferForSignal 方法能够转变该节点的状态,并入同步队列:

	final boolean transferForSignal(Node node) {
        /*
         * If cannot change waitStatus, the node has been cancelled.
         */
        if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
            return false;

        /*
         * Splice onto queue and try to set waitStatus of predecessor to
         * indicate that thread is (probably) waiting. If cancelled or
         * attempt to set waitStatus fails, wake up to resync (in which
         * case the waitStatus can be transiently and harmlessly wrong).
         */
        Node p = enq(node);
        int ws = p.waitStatus;
        if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
            LockSupport.unpark(node.thread);
        return true;
    }

文档说的很清楚,我就保留了。需要解释的是为什么前继节点的 waitStatus 为取消或者将前继节点的 waitStatus 设置为 SIGNAL 失败,需要唤醒当前线程?成功的话,就将前继节点更新为 SIGNAL ,这是需要的,失败的话,会重新执行下面这个 await 方法中的循环:

			while (!isOnSyncQueue(node)) {
                LockSupport.park(this);
                if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
                    break;
            }
			private int checkInterruptWhileWaiting(Node node) {
            	return Thread.interrupted() ?
                	(transferAfterCancelledWait(node) ? THROW_IE : REINTERRUPT) :
                	0;
        	}
			final boolean transferAfterCancelledWait(Node node) {
                // 上面这种情况这里会失败掉。
        		if (compareAndSetWaitStatus(node, Node.CONDITION, 0)) {
            		enq(node);
            		return true;
        		}
        		/*
         		* If we lost out to a signal(), then we can't proceed
         		* until it finishes its enq().  Cancelling during an
         		* incomplete transfer is both rare and transient, so just
         		* spin.
         		*/
        		while (!isOnSyncQueue(node))
	            	Thread.yield();
    	    	return false;
    		}

在最后带来的影响也就是它跳出循环,进入竞争锁的阶段,在这个阶段,还是有可能被阻塞。

只要进入同步队列,就有机会被唤醒,然后在 await 方法中能够结束:

			// 3.请求入CLH 队列
            if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
                interruptMode = REINTERRUPT;
            if (node.nextWaiter != null) // clean up if cancelled
                unlinkCancelledWaiters();
            if (interruptMode != 0)
                reportInterruptAfterWait(interruptMode);

如果是在同步队列中唤醒该线程(与上面介绍的错误流程到这里是不同的),也会进入到这里,尝试再次请求(acquireQueued),成功的话,就可以结束了,之前的线程就能恢复执行了。


总结

这里比较绕的一个点就是线程恢复执行的问题。举个列子,现在有线程A 调用 await 方法阻塞了,那么它 park 的位置在 await 方法里,如果线程 A 调用 lock 方法阻塞了,那么它最后的 park 位置在 acquireQueued 方法里调用的 parkAndCheckInterrupt 方法。而 await 被唤醒,会从 await 中结束掉,进入 acquireQueued方法, 如果最后没有获取到锁,仍然会进入 parkAndCheckInterrupt 方法里 park。这是比较重要的一个点,需要理解清楚!


还有两个困惑点:

  1. signal 中并没有释放锁的操作,那么在执行这个方法以后,await 方法还是不能结束的,因为它没有获取到锁。

    这是对的,之前,我一直认为,signal 会附带释放锁的操作,这样 await 方法就能够获取到锁,然后执行了。其实,仔细想想,如果这样的话,那 signal 方法内是不是也需要 park,那不就也需要唤醒嘛,这不就陷入循环啦?

  2. signal 是如何确保一定能够通知到 await 那个线程,并帮助它获得锁?

    举个例子,a 线程调用了 signal 方法, 它只是帮助调用 await 方法的 b 线程进入同步队列,至于 b 线程能不能获得锁,其实是和 a 线程的调用没有关系的!也就是说不能确认b线程在 a 线程最终释放了锁,就立刻能够获取锁,并执行,signal 方法只是帮助它进入同步队列,让它竞争锁,但不能保证一定是它。

  3. await 的超时方法,在时间到期后,能够返回执行线程嘛?
    还是不能的,时间到期以后,仍然需要入同步队列,获取到锁,才能正常返回;但可以通过返回值来判断到底有没有超时。


我与风来


认认真真学习,做思想的产出者,而不是文字的搬运工
错误之处,还望指出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值