JUC之三:AQS独占锁的获取过程(含ReentrantLock代码分析)


前言

  AQS(AbstractQueuedSynchronizer)是整个JUC并发框架的基础,其实现大量依赖了乐观锁(CAS+自旋)的方式,而获取锁/释放锁同步器状态则依靠子类实现。若子类未实现方法,而调用了则会抛出异常。
核心思想:
   如果被请求的共享资源空闲,则将请求资源的线程设置为有效的工作线程,并将共享资源设置为锁定状态。如果请求共享资源被锁定,那么就需要一套阻塞线程以及唤醒线程的机制,AQS是用CLH队列来实现的,即将获取不到资源的线程加入到双向队列中。

1、AQS核心

stat

同步器有一个state,它代表着当前同步器的状态,它是整个AQS的核心属性。我们平时使用的JUC框架下的常用类比如ReentrantLock,其实它们的方法就是在设置和改变这个state。而之前说的子类需要实现的方法,简单的说,它的实现逻辑也就是在设置和改变这个state。

private volatile int state;

如上,state已经被我们找到了,它一个volatile的变量,这样就保证了可见性。

由于本文分析的是独占锁,所以当state为0时,代表没有线程持有锁。当state为1时,代表有线程持有锁。当state>1时,代表有线程持有该锁,并且重入过该锁。所以state是否为0,可以作为判断是否有线程持有该独占锁的标准。

private transient Thread exclusiveOwnerThread;

而exclusiveOwnerThread成员则用来记录当前持有锁的线程。在其父类AbstractOwnableSynchronizer中的字段。

双向队列(等待队列)

AQS中已经为我们实现了一个FIFO的等待队列,它是一个双向链表。由于同步器的state一般不能让所有线程同时获得,所以将这些需要暂时等待的线程包装成一个节点放到队列中去,当获取state的条件满足时,会将这个节点内的线程唤醒,以便它接下来去尝试获取state。
队列是用Node节点来实现的,如下所示:

    static final class Node  {
    	//节点为共享节点
        static final Node SHARED = new Node();
        //节点为独占节点
        static final Node EXCLUSIVE = null;

        //1  代表线程被取消
        static final int CANCELLED =  1;
        //-1 阻塞/唤醒后继节点的信号
        static final int SIGNAL    = -1;
		// CONDITION,值为-2,表示当前节点在等待condition,也就是在condition队列中
        static final int CONDITION = -2;
		// PROPAGATE,值为-3,表示当前场景下后续的acquireShared能够得以执行
        static final int PROPAGATE = -3;
        //节点的状态 也就是上面的四个值 
        volatile int waitStatus;
        //双向队列前驱
        volatile Node prev;
        //双向队列后继
        volatile Node next;
        //当前节点持有的线程
        volatile Thread thread;
        //用来表明当前node的线程是想要获取共享锁还是独占锁
        Node nextWaiter;

        //是否是共享节点
        final boolean isShared() {
            return nextWaiter == SHARED;
        }
        //返回节点前驱,为null报错
        final Node predecessor() throws NullPointerException {
            Node p = prev;
            if (p == null)
                throw new NullPointerException();
            else
                return p;
        }

        Node() {    // Used to establish initial head or SHARED marker
        }

        Node(Thread thread, Node mode) {     // Used by addWaiter
            this.nextWaiter = mode;
            this.thread = thread;
        }

        Node(Thread thread, int waitStatus) { // Used by Condition
            this.waitStatus = waitStatus;
            this.thread = thread;
        }
    }
  • 作为双向链表的节点,自然需要prev和next,即前驱和后继指针。通过这两个指针将各节点连接起来。
  • thread成员肯定也是必需的。因为Node就是用来设计包装线程对象的,自然需要一个Thread类型的成员。
  • nextWaiter成员则是用来表明当前node的线程是想要获取共享锁还是独占锁。注意,这个成员只是这个作用,不是用来连接双向链表的。
  • 最重要的还是waitStatus成员,用来表明node代表线程的状态。

AQS头节点与尾节点

// 头结点,固定是一个dummy node,因为它的thread成员固定为null,换句话说,头节点就是持有锁的线程的节点
private transient volatile Node head;

// 尾节点,请求锁失败的线程,会包装成node,放到队尾
private transient volatile Node tail;

head和tail都是AQS的成员,分别代表队列的头和尾,通过持有这两个成员,相当于AQS也持有了这个队列。
AQS队列示意图

等待队列如上图所示,注意head节点作为一个dummy node,它的thread成员一定为null,说白了head节点就是持有锁的节点

  • head节点的thread成员为null,可以理解为将它的thread成员放到AQS的exclusiveOwnerThread属性上去了,所以它的thread成员为null。
  • 即使等待线程只有一个,等待队列中的节点个数也肯定是2个,因为第一个节点总是dummy node。

CAS

cas是乐观锁的一种实现方式,CAS是一种轻量级的并发处理,在对AQS属性以及队列节点属性进行修改时,都会用到CAS操作。既然是多线程环境下,那么就会有多个线程同时修改这些属性,而CAS保证了同一时刻只有一个线程能修改成功,而其他CAS操作失败的线程,一般则会通过自旋继续尝试CAS操作。

CAS是利用Unsafe工具类来完成CAS的操作的,主要针对一下属性:

  • head
  • tail
  • state
  • waitStatus

2、ReentrantLock内部类

public class ReentrantLock implements Lock, java.io.Serializable {
    private final Sync sync;
    //继承了 AQS,公平锁和非公平锁又继承了Sync来使用AQS
    abstract static class Sync extends AbstractQueuedSynchronizer {
        ...
    }
    
    static final class NonfairSync extends Sync{
        ...
    }
    
    static final class FairSync extends Sync {
        ...
    }
    // 默认是非公平锁
    public ReentrantLock() {
        sync = new NonfairSync();
    }
    // 根据参数,设置公平或非公平
    public ReentrantLock(boolean fair) {
        sync = fair ? new FairSync() : new NonfairSync();
    }
    
    // 获取锁
    public void lock() {
        sync.lock();
    }
    
    ...
}

可以看到ReentrantLock使用AQS都是通过使用子类:

  • Sync继承了AbstractQueuedSynchronizer,在Sync里,实现了tryRelease(父类中的实现是抛出异常)。
  • NonfairSync和FairSync都继承了Sync,在NonfairSync和FairSync里,会调用acquire(父类已有的实现),会实现tryAcquire(父类中的实现是抛出异常)。
  • AQS可以实现 独占锁和共享锁,但ReentrantLock只使用了独占锁部分。获取锁的方式可以分为公平和非公平,响应中断和不响应中断。本文将以公平、不响应中断的方式作为切入点,来分析AQS源码。

3、公平锁、非公平锁、独占锁的获取

获取锁的第一步是

       final void lock() {
       		//AQS中的方法
            acquire(1);
        }
	
    public final void acquire(int arg) {
        if (!tryAcquire(arg) &&
            acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
            selfInterrupt();
    }
  1. tryAcquire用来获取独占锁一次,try的意思就是只试一次,要么成功,要么失败。
  2. tryAcquire返回true时,后面的三个函数都不会执行了。
  3. tryAcquire返回false时,必将调用addWaiteracquireQueued
  4. addWaiter是AQS的实现,因为开始获取锁失败了(tryAcquire返回false),所以需要把当前线程包装成node放到等待队列中,返回代表当前线程的node。
  5. acquireQueued是AQS的实现,简单的理解就是:用一个死循环不断得去执行tryAcquire,直到获取锁。当然:
     - 程序不会真的在死循环,一般情况下,会不断经历阻塞和被唤醒 两种状态。
     - 当参数node的前驱是head时,才会去tryAcquire尝试获得锁。
  6. selfInterrupt用来复原中断状态,虽然这个版本的函数不用响应中断。当acquireQueued返回真时,代表这期间函数曾经检测到过中断状态,并且将中断状态消耗掉了(Thread.interrupted()),所以需要在退出acquire之前,将中断状态重新设置上。
    若acquire方法执行完毕,代表已经获取到锁了。

tryAcquire

前面提到,tryAcquire在ReentrantLock里,NonfairSyncFairSync分别实现了tryAcquire,而我们这里从FairSync的tryAcquire看起。
简单的来说,公平锁里的tryAcquire实现就是先查看是否有线程已经在等待获取锁了,如果有则返回false,若没有则尝试设置锁给当前线程。

 protected final boolean tryAcquire(int acquires) {
		final Thread current = Thread.currentThread();
		int c = getState();
		if (c == 0) {
			1、判断是否有其他线程在排队
			2、通过cas直接设置state,让当前线程持有锁
		    if (!hasQueuedPredecessors() &&
		        compareAndSetState(0, acquires)) {
		        setExclusiveOwnerThread(current);
		        return true;
		    }
		}
		3、可重入锁,当前线程已经持有锁了,又获取了锁
		else if (current == getExclusiveOwnerThread()) {
		    int nextc = c + acquires;
		    if (nextc < 0)
		        throw new Error("Maximum lock count exceeded");
		    setState(nextc);
		    return true;
		}
		return false;
	}
  • 参数acquires代表你想让同步器的state再增加多少。函数返回值为true,代表你成功获取到了锁。返回true时,同步器的state已经增加了acquires,且Thread exclusiveOwnerThread成员被设置成了当前执行线程。
  • 首先获得同步器的state。
  • 如果进入if (c == 0)分支,说明当前state为0,当前锁已经被释放掉了,但此时CHL队列中可能有线程已经在排队了(考虑到此版本是公平锁),所以需要通过hasQueuedPredecessors判断队列中是否已经有等待线程(返回true代表有)。
       1、hasQueuedPredecessors返回true,那么直接返回false,说明tryAcquire失败。
       2、hasQueuedPredecessors返回false,才会尝试CAS操作设置state。如果CAS操作成功,那么说明当前线程成功抢到了锁,调用setExclusiveOwnerThread设置独占线程;如果CAS操作失败,那么直接返回false,说明此次tryAcquire失败。
  • 如果进入else if (current == getExclusiveOwnerThread())分支,说明当前state不为0,已经有线程持有锁,但考虑锁可重入,如果当前线程就是AQS的独占线程的话,那么就直接让state再加acquires;如果当前线程根本不是AQS的独占线程,那么直接返回false,说明此次tryAcquire失败。

tryAcquire的逻辑总结来说:

  • 当锁已经被释放时(state为0),先以公平的方式判断是否可以尝试获得锁(hasQueuedPredecessors的返回值),再尝试获得锁(通过CAS操作设置state为1)。
  • 当锁已经被占有时,判断一下是否是自己占有的(current ==
    getExclusiveOwnerThread()),如果是就重入这个锁。
  • 需要注意,前者设置state使用的是CAS操作,因为此时当前线程还没有获得锁,不一定谁能竞争到,所以用CAS保证只有一个线程能设置state成功;而后者直接set,是因为当前线程已经获取锁了,此时别的线程都不能修改state,即只有当前线程在写state,所以直接set是安全的。

addWaiter

既然执行到了addWaiter,说明当前线程第一次执行tryAcquire时失败了。既然获取锁失败了,那么就需要将当前线程包装一个node,放到等待队列的队尾上去,以后锁被释放时别人就会通过这个node来唤醒自己。


    private Node addWaiter(Node mode) {
        Node node = new Node(Thread.currentThread(), mode);
        1、使用enq的快捷方法,如果CAS操作失败,才会去执行enq 
        Node pred = tail;
        2、如果队列不为空
        if (pred != null) {
            node.prev = pred;
            if (compareAndSetTail(pred, node)) {
                pred.next = node;
                return node;
            }
        }
        3、 执行到这里,有两种情况:
        3.1.队列为空。head和tail成员从来没有初始化过
        3.2.CAS操作失败。当执行compareAndSetTail时,tail成员已经被修改了
        enq其实是一个自旋操作。
        enq(node);
        return node;
    }

由于当初这么调用的addWaiter(Node.EXCLUSIVE),然后会调用下面的这版构造器。由此可见,刚放到队尾的node,它的nextWaiter肯定为null,它的waitStatus为0(默认初始化)。

        static final Node EXCLUSIVE = null;
        
        Node(Thread thread, Node mode) {     // Used by addWaiter
            this.nextWaiter = mode;
            this.thread = thread;
        }
  • 函数的主要逻辑,其实跟enq函数中一样,所以称它为enq的快捷方式,区别在于enq是循环执行这段逻辑。逻辑为:当队列不为空时,CAS尝试tail成员为新创建的node,如果成功,那么将next指针修正,并返回这个node。该函数既然完成了 将当前线程所包装成的node放在队尾的使命,自然就可以返回该node了。
  • 如果执行到了enq(node),那么可能有两种情况:
      1、队列为空。headtail成员从来没有初始化过。
      2、CAS操作失败。当执行compareAndSetTail时,tail成员已经被修改了。
  • 自然,enq函数能保证 在多线程下 安全得将 该node放到队尾去,它的具体做法是 自旋+CAS。
  • 不管是提前return,还是执行完enq再return,当return时,已经是将代表当前线程的node放到队尾了。注意,返回的是,代表当前线程的node。

enq

由于addWaiter的时候并没有成功将刚创建的node放到队尾,这时需要enq出马了。

    private Node enq(final Node node) {
        for (;;) {
            Node t = tail;
            // 如果tail为null,说明队列为空,head肯定也为null
            // 进一步说明 等待队列的初始化是懒汉式的
            if (t == null) { 
                if (compareAndSetHead(new Node()))
                    tail = head;
            // 如果tail不为null,说明队列至少有一个dummy node,head肯定也不为null
            } else {
                node.prev = t;
                if (compareAndSetTail(t, node)) {
                    t.next = node;
                    return t;
                }
            }
        }
    }
  • 进入if (t == null)分支,tail为null,说明队列为空,head肯定也为null。然后尝试CAS设置head成员。

    1、注意,如果队列从来没有初始化过(head、tail为null),那么这个循环至少得执行两次,第一次给队列新建一个空node,第二次进if (t == null)的else分支,把参数node放在空node的后面。
    2、根据上一条可知,就算只有一个线程入队,入队完毕后队列将有两个node,第一个node称为dummy node,因为它的thread成员为null;第二个node才算是实际意义的队头,它的thread成员不为null。
    3、新建的是空node,它的所有成员都是默认值。thread成员为null,waitStatus为0。之后你会发现,队尾node的waitStatus总是0,因为默认初始化。
    4、compareAndSetHead作为一个CAS操作只有一个参数,是因为它的实现是unsafe.compareAndSwapObject(this, headOffset, null, update);。
compareAndSetHead的CAS操作也可能失败,当队列为空时,两个线程同时执行到enq。

  1. 进入if (t == null)的else分支,tail不为null,说明队列至少有一个dummy node,head肯定也不为null。
        1、先令node的prev指向tail,但只有CAS设置node为tail成功后,才会将tail的next指向node,才会将双向链表的指针都正确完成指向。
        2、compareAndSetTail(t, node)可能失败,当多个线程都执行到了node.prev = t这里。
        3、这个循环只有在compareAndSetTail(t, node)成功时才会退出循环,这就保证了enq最终肯定能将参数node放到队尾。
  2. 简单总结就是:enq利用了自旋(循环)和CAS操作,保证了node放到队尾。

enq的尾分叉 与 prev的有效性

在队列已经有node的情况下,如果同时有多个线程执行到node.prev = t这里,最终只有一个线程能够成功设置tail成员。

            } else {
                node.prev = t;  // 1
                if (compareAndSetTail(t, node)) {  // 2
                    t.next = node;  // 3
                    return t;
                }
            }

从上面看,发现要完成双向链表的指针指向,需要经过3步:

  1、将参数node的前驱指向tail。
  2、CAS设置参数node为tail。
  3、如果CAS成功,则修正tail的后继。

因为CAS操作的保证,所有线程都能够执行第1步,但第2、3步只会有一个线程能够执行到。
在这里插入图片描述
**enq的尾分叉:**从上面的步骤可以看出,如果存在很多个线程都刚好执行到了node.prev = t这里,那么CAS失败的线程不能成功入队,此时它们的prev还暂时指向的旧tail。

**prev的有效性:**从上图第二步可以看到,此时线程1的node已经是成功放到队尾了,但此时队列却处于一个中间状态,前一个node的next还没有指向队尾呢。此时,如果另一个线程如果通过next指针遍历队列,就会漏掉最后那个node;但如果另一个线程通过tail成员的prev指针遍历队列,就不会漏掉node了。

prev的有效性也解释了AQS源码里遍历队列时,为什么常常使用tail成员prev指针来遍历,比如你看unparkSuccessor方法。

acquireQueued

acquireQueued函数是整个独占锁获取的精华部分,它解释了独占锁获取的整个过程。

执行到这个函数,说明:

  • 当前线程已经执行完了addWaiter方法。
  • 传入的node的thread成员就是当前线程。
  • 传入的node已经成功入队。(addWaiter的作用)

简单的说,acquireQueued是利用自旋+tryAcquire“不断”地尝试获取锁,当然实际上如果真的是在死循环来不断调tryAcquire,肯定电脑都卡死了。实际流程是:

  • 每次循环都会判断是否可以尝试获取锁(p == head),如果可以,那么尝试(tryAcquire(arg))。

    如果尝试获取锁成功,那么函数的使命就达到了,执行完相应收尾工作,然后返回。

  • 如果 不可以尝试 或者 尝试获取锁却失败了,那么阻塞当前线程(parkAndCheckInterrupt)。
  • 如果当前线程被唤醒了,又会重新走这个流程。被唤醒时,是从parkAndCheckInterrupt处唤醒,然后从这里继续往下执行。
final boolean acquireQueued(final Node node, int arg) {
	//成功失败标志
    boolean failed = true;
    try {
    	//线程中断标志
        boolean interrupted = false;
        for (;;) {
        	1、获取node的前驱
            final Node p = node.predecessor();
            2、如果前驱为head节点,并获取锁成功,可以获取所得前提是node的前驱是head节点
            if (p == head && tryAcquire(arg)) {
            	2.1、将node设置为head节点
                setHead(node);
                p.next = null; // help GC
                failed = false;
                return interrupted;
            }
            3、执行到这个位置说明node前驱不是头节点,或没有获取到锁
            3.1、shouldParkAfterFailedAcquire方法作用:判断node节点是否需要阻塞
            3.2、parkAndCheckInterrupt阻塞线程,唤醒之后返回线程是否中断过
            if (shouldParkAfterFailedAcquire(p, node) &&
                parkAndCheckInterrupt())
                interrupted = true;
        }
    } finally {
        if (failed)
            cancelAcquire(node);
    }
}

问题1: 为什么tryAcquire(arg)的前提是p == head?
因为从enq的逻辑可知,head只会是一个dummy node,实际意义的node只会在head的后面。而node的前驱是head(final Node p = node.predecessor()),则代表node已经是队列中的第一个实际node了,排在最前面的node自然可以尝试去获取锁了。

问题2: 回想整个调用过程,是最开始在acquire里调用tryAcquire就已经失败了,然而此时第一次循环时,又可能马上去调tryAcquire(说可能,是因为需要p == head成立),这会不会是一次肯定失败的tryAcquire?
考虑这种场景,线程1获取了锁正在使用还没释放,此时队列为空,线程2此时也来获取锁,自然最开始在acquire里调用tryAcquire会失败,假设线程2刚开始执行acquireQueued,此时线程1释放了锁,此时线程2肯定排在head后面,那么线程2马上tryAcquire,然后就可以获取成功。

问题3: 执行acquireQueued的线程是谁?
一定是node参数的thread成员,虽然执行过程中,可能会经历不断 阻塞和被唤醒 的过程。

问题4: 为什么刚执行完addWaiter方法时,才把代表当前线程的node放到队尾,怎么之后一判断就会发现自己处于head的后继了?
这个问题不考虑上面的特殊场景,而考虑addWaiter时,队列中有许多node。其实这很合理,这说明从head到当前方法栈中的node之间的那些node,它们自己也会在执行acquireQueued,它们依次执行成功(指p == head && tryAcquire(arg)成功),每次执行成功相当于把head成员从队列上后移一个node,当它们都执行完毕,当前方法栈中的node自然也就是head的后继了。
注意,“之间的那些node”的最后一个node执行acquireQueued成功后(代表 最后一个node的代表线程获得锁成功,它自己成为了head),当前方法还在阻塞之中,只有当这“最后一个node”释放独占锁时,才会执行unparkSuccessor(head),当前线程才会被唤醒。关于释放独占锁,以后再具体讲。

问题5: finally块是否会执行cancelAcquire(node)?
虽然号称此函数是不响应中断的函数,但不响应中断只是对于AQS的使用者来说,如果一个线程阻塞在parkAndCheckInterrupt这里,别的线程来中断它,它是会马上唤醒的,然后继续这个循环。不过想要退出这个函数,只有通过return interrupted,而前一句就是failed = false,所以finally块里,是永远不会去执行cancelAcquire(node)的。

如下图,演示了多个线程依次获得独占锁的过程。
head过程

从逻辑中可见,如果当前线程获取锁成功,代表当前线程的node会新设置自己为head,然后将其弄成dummy node,即把node的thread成员清空,但这个被清空的thread成员已经在tryAcquire里将这个thread设置为了exclusiveOwnerThread

  • 可以这么理解,head之所以它的thread成员为null,是因为它的thread成员被放在了exclusiveOwnerThread成员里。
  • 使用setHead而非compareAndSetHead,因为此时不需要CAS操作,执行到这里说明当前线程已经获得了独占锁(tryAcquire成功),所以别的线程是不可能同时执行这部分代码的。

shouldParkAfterFailedAcquire

我们先把函数名分成两部分:

shouldPark:指的是 该函数的返回值影响是否可以执行parkAndCheckInterrupt函数。因为
shouldParkAfterFailedAcquire(p, node) && parkAndCheckInterrupt()这么写,
只有当该函数返回true时,才会去执行parkAndCheckInterrupt。注意,parkAndCheckInterrupt
函数执行后,当前线程就会被挂起了,也就是我们所说的阻塞。
AfterFailedAcquire:指的是 获取锁失败了才会执行该函数。其实具体指两种情况:
1. p == head为false,即当前线程的node的前驱不是head
2. 虽然 p == head为true,但tryAcquire返回false了,即当前线程虽然已经排到等待队列
的最前面,但获取锁还是失败了。

回想之前讲过的函数,发现它们居然都没有使用过waitStatus这个属性,而现在就可以派上用场了。

  • static final int CANCELLED = 1; 线程被取消
  • static final int SIGNAL = -1; 阻塞唤醒后继线程的标志
  • static final int CONDITION = -2;
  • static final int PROPAGATE = -3;

node一共有四种状态,但在独占锁的获取和释放过程中,我们只可能将node的状态变成CANCELLED或SIGNAL,而shouldParkAfterFailedAcquire函数就会把一个node的状态变成SIGNAL。注意,一个node新建的时候,它的waitStatus是默认初始化为0的。

  • CANCELLED,一个node的状态是CANCELLED,说明这个node的代表线程已经取消等待了。
  • SIGNAL,一个node的状态是SIGNAL,说明这个node的后继node的代表线程已经阻塞或马上阻塞(shouldParkAfterFailedAcquire设置前驱为SIGNAL后,下一次的acquireQueued循环可能就会阻塞了,所以说“已经阻塞或马上阻塞”),并且当前node成为head并释放锁时,会根据SIGNAL来唤醒后继node。即SIGNAL是唤醒后继节点的标志。
  • 有趣的是,CANCELLED状态与当前node关联,SIGNAL状态与后继node关联。

本函数,简单的讲就是,跳过无效前驱,把node的有效前驱(有效是指node不是CANCELLED的)找到,并且将有效前驱的状态设置为SIGNAL,之后便返回true代表马上可以阻塞了。

    private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
        int ws = pred.waitStatus;
        if (ws == Node.SIGNAL)
            /*
             * 前驱节点已经设置了SIGNAL,闹钟已经设好,现在我可以安心睡觉(阻塞)了。
             * 如果前驱变成了head,并且head的代表线程exclusiveOwnerThread释放了锁,
             * 就会来根据这个SIGNAL来唤醒自己
             */
            return true;
        if (ws > 0) {
            /*
             * 发现传入的前驱的状态大于0,即CANCELLED。说明前驱节点已经因为超时或响应了中断,
             * 而取消了自己。所以需要跨越掉这些CANCELLED节点,直到找到一个<=0的节点
             */
            do {
                node.prev = pred = pred.prev;
            } while (pred.waitStatus > 0);
            pred.next = node;
        } else {
            /*
             * 进入这个分支,ws只能是0或PROPAGATE。
             * CAS设置ws为SIGNAL
             */
            compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
        }
        return false;
    }

  • 如果前驱节点的状态为SIGNAL,说明闹钟标志已设好,返回true表示设置完毕。
  • 如果前驱节点的状态为CANCELLED,说明前驱节点本身不再等待了,需要跨越这些节点,然后找到一个有效节点,再把node和这个有效节点的前驱后继连接好。
  • 如果是其他情况,那么CAS尝试设置前驱节点为SIGNAL。

由于shouldParkAfterFailedAcquire函数在acquireQueued的调用中处于一个死循环中,且因为shouldParkAfterFailedAcquire函数若返回false,且考虑当前线程一直不能获取到锁的情况,那么此函数必将至少执行两次才能阻塞自己。

  • shouldParkAfterFailedAcquire只有在检测到前驱的状态为SIGNAL才能返回true,只有true才会执行到parkAndCheckInterrupt。
  • shouldParkAfterFailedAcquire返回false后,进入下一次循环,当前线程又会再次尝试获取锁(p == head && tryAcquire(arg))。或者说,每次执行shouldParkAfterFailedAcquire,都说明当前循环尝试过获取锁了,但失败了。 如果刚开始前驱的状态为0,那么需要第一次执行compareAndSetWaitStatus(pred, ws,
    Node.SIGNAL)返回false并进入下一次循环,第二次才能进入if (ws == Node.SIGNAL)分支,所以说至少执行两次。
  • 死循环保证了最终一定能设置前驱为SIGNAL成功的。(考虑当前线程一直不能获取到锁)

parkAndCheckInterrupt

既然shouldParkAfterFailedAcquire已经返回了true,那么我现在可以执行parkAndCheckInterrupt了。

    private final boolean parkAndCheckInterrupt() {
        LockSupport.park(this);  //阻塞当前线程
        return Thread.interrupted();
    }

调用完LockSupport.park(this),当前线程就阻塞在这里,直到有别的线程unpark了当前线程,或者中断了当前线程。而返回的Thread.interrupted()代表当前线程在阻塞的过程中,有没有被别的线程中断过,如果有,则返回true。注意,Thread.interrupted()会消耗掉中断的状态,即第一次执行能返回true,但紧接着第二次执行就只会返回false了。

  • 如果是别的线程unpark了当前线程,那么调用Thread.interrupted()返回false。
  • 如果是别的线程中断了当前线程,那么调用Thread.interrupted()返回true。

回到acquireQueued的逻辑中,发现一旦当前线程被中断过一次,那么parkAndCheckInterrupt就返回了true,那么执行interrupted = true,interrupted局部变量就一定是true的了。

    final boolean acquireQueued(final Node node, int arg) {
        boolean failed = true;
        try {
            boolean interrupted = false;
            for (;;) {
                final Node p = node.predecessor();
                if (p == head && tryAcquire(arg)) {
                    // 获取锁成功后
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return interrupted;
                }
                if (shouldParkAfterFailedAcquire(p, node) &&
                    parkAndCheckInterrupt())  //这里返回了true,说明上一行也返回了true才会执行到这里
                    interrupted = true;  //这里设置后,会被永久保留
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

再等到当前线程获取锁成功后,那么acquireQueued返回的就一定是true了。再回到acquire的逻辑,发现需要进入if分支,再执行selfInterrupt()将中断状态补上,这样下一次Thread.interrupted()就能返回true了。为的就是在 回到用户代码之前,把中断状态补上,万一用户需要中断状态呢。


    public final void acquire(int arg) {
        if (!tryAcquire(arg) &&
            acquireQueued(addWaiter(Node.EXCLUSIVE), arg))  //acquireQueued返回了true
            selfInterrupt(); //中断状态补上
    }
    

4、不公平的、不响应中断的 独占锁的获取

其实不公平锁与公平锁之间的差别只会体现在AQS子类的重写方法中,所以我们直接看子类实现就好。使用不公平锁对ReentrantLock来说,还是直接调用ReentrantLock.lock(),没有区别。要想使用非公平锁,必须在构造ReentrantLock时指定好。

ReentrantLock内部类

//ReentrantLock.java
    abstract static class Sync extends AbstractQueuedSynchronizer {
    	...
        final boolean nonfairTryAcquire(int acquires) {
            final Thread current = Thread.currentThread();
            int c = getState();
            if (c == 0) {
                if (compareAndSetState(0, acquires)) {
                    setExclusiveOwnerThread(current);
                    return true;
                }
            }
            else if (current == getExclusiveOwnerThread()) {
                int nextc = c + acquires;
                if (nextc < 0) // overflow
                    throw new Error("Maximum lock count exceeded");
                setState(nextc);
                return true;
            }
            return false;
        }
        ...
	}


    static final class NonfairSync extends Sync {
        private static final long serialVersionUID = 7316153563782823691L;

        final void lock() {
        	// if分支里的逻辑只是一次快速尝试
        	// 它和nonfairTryAcquire里的部分逻辑是一样的
            if (compareAndSetState(0, 1))
                setExclusiveOwnerThread(Thread.currentThread());
            else
                acquire(1);
        }

        protected final boolean tryAcquire(int acquires) {
        	// 将nonfairTryAcquire的逻辑直接放在这里,就把公平锁看起来一样了
            return nonfairTryAcquire(acquires);
        }
    }

  • 与公平锁相比,非公平锁的lock实现略有不同。公平锁的lock实现是直接调用acquire(1),而非公平锁的lock实现会先尝试CAS修改state,如果能够将state从0改成1,那么说明当前线程获取锁,既然获取锁,那么便直接插队setExclusiveOwnerThread(Thread.currentThread())。如果CAS操作失败,再走正常流程,调用父类函数acquire(1)。
  • 再看子类实现nonfairTryAcquire,发现和公平锁的实现tryAcquire几乎一模一样,除了公平锁需要多判断一下hasQueuedPredecessors的返回值,也就是需要判断队列是否等待线程。

其实非公平锁的原理就是:不管等待队列中是否有等待线程,直接竞争获取state,要是获取成功了,就直接设置当前线程为exclusiveOwnerThread成员了(插队成功)。这不就是,插了所有等待线程的队嘛。也就是说,非公平锁它可以和队列中的head后继的代表线程同时竞争锁。

    public final void acquire(int arg) {
        if (!tryAcquire(arg) &&  // 非公平锁插队的机会,只有这里tryAcquire的时候
            acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
            selfInterrupt();
    }

非公平锁只有在这儿的tryAcquire中才会插队,若插队失败,其实是公平锁一样的,放入到队列中,进入acquireQueued的死循环,在acquireQueued方法中执行tryAcquire需要先判断p==head,也就是当前线程节点必须是head的后继

总结:

  • 非公平锁插队的机会只有,acquire方法里第一次执行tryAcquire的时候,如果这次插队失败,那么它也不可能插队成功了。
  • 公平锁和非公平锁,在进入acquireQueued之后,使用起来没有任何区别。

5、响应中断的 独占锁的获取(lockInterruptibly)

使用响应中断的锁对ReentrantLock来说,是调用ReentrantLock.lockInterruptibly()。从下面函数中,可以看到函数都会抛出InterruptedException异常,这是我们能看到的第一处不同,他与lock的区别其实就是只要是线程被中断就会抛出异常

//ReentrantLock.java
    public void lockInterruptibly() throws InterruptedException {
        sync.acquireInterruptibly(1);
    }
//AbstractQueuedSynchronizer.java
    public final void acquireInterruptibly(int arg)
            throws InterruptedException {
        if (Thread.interrupted())
            throw new InterruptedException();
        if (!tryAcquire(arg))
            doAcquireInterruptibly(arg);
    }

acquireInterruptibly这个方法与 不响应中断的acquire方法 对应。同样的,进入这个方法后,会第一次进行tryAcquire尝试。但不同的,此acquireInterruptibly函数中,会去检测Thread.interrupted(),并抛出异常。

但注意,对于acquireInterruptibly这个方法而言,既可以是公平的,也可以是不公平的,这完全取决于tryAcquire的实现(即取决于ReentrantLock当初是怎么构造的)。


    private void doAcquireInterruptibly(int arg)
        throws InterruptedException {
        final Node node = addWaiter(Node.EXCLUSIVE);
        boolean failed = true;
        try {
            for (;;) {
                final Node p = node.predecessor();
                if (p == head && tryAcquire(arg)) {
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return;
                }
                if (shouldParkAfterFailedAcquire(p, node) &&
                    parkAndCheckInterrupt())
                    throw new InterruptedException();
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

而doAcquireInterruptibly方法 的相对应的方法为acquireQueued方法。观察两个方法的差别很少:

  • doAcquireInterruptibly没有返回值,而acquireQueued方法有返回值,代表当前线程是否被中断过。

    acquireQueued方法需要有返回值,因为函数调用返回上层  后,需要根据返回值来判断是否需要重新设置中断状态,在返回用户代码之前。
    doAcquireInterruptibly不需要返回值,因为该函数中如果检测到了中断状态,就直接抛出异常就好了。

  • doAcquireInterruptibly方法的finally块是可能会执行到cancelAcquire(node)的,而acquireQueued方法不可能去执行cancelAcquire(node)的。

    在doAcquireInterruptibly方法中,如果线程阻塞在parkAndCheckInterrupt这里后,别的线程来中断阻塞线程,阻塞线程会被唤醒,然后抛出异常。本来抛出异常该函数就马上结束掉的,但由于有finally块,所以在结束掉之前会去执行finally块,并且由于failed为true,则会执行cancelAcquire(node)。

回忆起node有一种CANCELLED状态,看来就是为cancelAcquire(node)准备的了。

取消线程/中断线程
 private void cancelAcquire(Node node) {
        // Ignore if node doesn't exist
        1、防止抛出异常
        if (node == null)
            return;
        node.thread = null;

        // Skip cancelled predecessors
        2、获取前驱节点
        Node pred = node.prev;
        3、waitStatus大于0说明线程被取消,过滤取消线程,找到可用线程
        while (pred.waitStatus > 0)
            node.prev = pred = pred.prev;

        // predNext is the apparent node to unsplice. CASes below will
        // fail if not, in which case, we lost race vs another cancel
        // or signal, so no further action is necessary.

        // pred的后继无论如何都需要取消,因为即使前面循环没有执行,
        // 现在pred的后继(肯定是参数node)也是一个马上取消掉的node。
        // 之后有些CAS操作会尝试修改pred的后继,如果CAS失败,那么说明有别的线程在做
        // 取消动作或通知动作,所以当前线程也不需要更多的动作了。
        Node predNext = pred.next;

        // Can use unconditional write instead of CAS here.
        // After this atomic step, other Nodes can skip past us.
        // Before, we are free of interference from other threads.
        
        // 这里直接使用赋值操作,而不是CAS操作。
        // 如果别的线程在执行这步之后,别的线程将会跳过这个node。
        // 如果别的线程在执行这步之前,别的线程还是会将这个node当作有效节点。
        node.waitStatus = Node.CANCELLED;

        // If we are the tail, remove ourselves.
        4、如果node是尾节点,则直接将前一个可用节点设置为尾节点,尾节点后继直接设置为null
        if (node == tail && compareAndSetTail(node, pred)) {
            compareAndSetNext(pred, predNext, null);
        } else {
            // If successor needs signal, try to set pred's next-link
            // so it will get one. Otherwise wake it up to propagate.
            5、判断是否唤醒node的后继,这种情况是pred为head被取消或执行结束,否则需要把node的后继编程pred的后继
            int ws;
            if (pred != head &&
                ((ws = pred.waitStatus) == Node.SIGNAL ||
                 (ws <= 0 && compareAndSetWaitStatus(pred, ws, Node.SIGNAL))) &&
                pred.thread != null) {
                Node next = node.next;
            	5.1、设置node的后继为pred的后继
                if (next != null && next.waitStatus <= 0)
                    compareAndSetNext(pred, predNext, next);
            } else {
            	6、唤醒下一个等待的线程
                unparkSuccessor(node);
            }
            //帮助gc回收垃圾
            node.next = node; // help GC
        }
    }

如果node是队尾,那说明node后面没有节点,也就不存在节点需要去唤醒了。

分析node不是队尾的情况,既然不是队尾,说明node后面有节点。如下图所示。

这里面又有分支,先直接看进入分支要做什么,再来分析进入分支的条件:

  • 在if分支里,去做compareAndSetNext(pred, predNext,next),即修复pred的后继,完善双向链表的指针。但这样做有一个前提,就是需要pred的状态已经是SIGNAL的了。
  • 在else分支里,去做unparkSuccessor(node),去唤醒node后继。
    cancel节点
  • pred !=head不成立,那么说明pred就是head,执行else分支。node的后继运气爆棚,因为node自己取消掉了,node的后继便成为了等待队列中第一个线程(即成为了head后继),自然需要去唤醒它了(unparkSuccessor(node))。
  • pred != head成立,但(ws = pred.waitStatus) == Node.SIGNAL || (ws <= 0 &&
    compareAndSetWaitStatus(pred, ws, Node.SIGNAL))不成立,执行else分支。
      1、第一个条件成立,说明pred并不是head。
      2、第二个条件不成立,里面是||,说明是两个子条件都不成立。有下面情况:
        2.1、如果pred的状态是CANCELLED。这似乎有点矛盾,因为之前的for循环已经判断过pred的状态是 <= 0的了,但你要知道多线程环境下,什么都可能发生。很可能从for循环执行到这里的时候,pred又被取消掉了。考虑到pred如果是head后继的话,那么node后继就一下子成为了队列中第一个线程了,所以还是有必要执行unparkSuccessor(node)。
        2.2、如果pred的状态是 <= 0但还不是SIGNAL,但CAS设置pred的状态为SIGNAL却失败了。SIGNAL是作为后继节点被唤醒的标志而存在的,现在居然没有设置成功,所以很有必要执行unparkSuccessor(node)。
  • pred != head成立,(ws = pred.waitStatus) == Node.SIGNAL || (ws <= 0 &&
    compareAndSetWaitStatus(pred, ws, Node.SIGNAL))也成立,但pred.thread !=
    null不成立,执行else分支。
      1、第一个条件成立,说明pred并不是head。
      2、第二个条件成立,里面是 ||,说明是两个子条件要么前真,要么前假后真。
        2.1、如果是前真,那么说明pred的状态已经是SIGNAL。
        2.2、如果是前假后真,那么说明pred的状态是0或PROPAGATE,且接下来的CAS操作也成功了,即成功设置为SIGNAL。
      3、第三个条件不成立,说明pred变成了一个dummy node了。要么pred是变成head了,要么pred突然被取消了(执行了node.thread = null)。这两种情况,前者必须执行unparkSuccessor(node),后者只是有必要执行。
  • pred != head成立,(ws = pred.waitStatus) == Node.SIGNAL || (ws <= 0 &&
    compareAndSetWaitStatus(pred, ws, Node.SIGNAL))也成立,且pred.thread !=
    null也成立,只有这里才执行if分支。说明闹钟设置成功,并且设置的node也不是个空节点,那么只需要将pred与node后继相连即可(compareAndSetNext(pred,
    predNext, next))。

总结一下cancelAcquire:

  • 如果闹钟设置成功,且闹钟都在node不是一个dummy node,那么将pred与node后继相连,让node后继继续安心睡觉。
  • 如果发现node后继已经是排队的第一个了、发现闹钟没有设置成功、发现闹钟设置成功但闹钟所在节点变空节点,都需要换线node后继。

6、超时的 独占锁的获取

使用超时的锁对ReentrantLock来说,是调用public boolean tryLock(long timeout, TimeUnit unit)。从下面函数中,可以看到函数都会抛出InterruptedException异常,这是我们能看到的第一处不同。

//ReentrantLock.java
    public boolean tryLock(long timeout, TimeUnit unit)
            throws InterruptedException {
        return sync.tryAcquireNanos(1, unit.toNanos(timeout));//第二个实参,换算得到nano
    }
//AbstractQueuedSynchronizer.java
    public final boolean tryAcquireNanos(int arg, long nanosTimeout)
            throws InterruptedException {
        if (Thread.interrupted())
            throw new InterruptedException();
        return tryAcquire(arg) ||
            doAcquireNanos(arg, nanosTimeout);
    }

tryAcquireNanos这个方法与 不响应中断的acquire方法 对应。同样的,进入这个方法后,会第一次进行tryAcquire尝试。但不同的,此tryAcquireNanos函数中,会先去检测Thread.interrupted(),并抛出异常。

但注意,对于tryAcquireNanos这个方法而言,既可以是公平的,也可以是不公平的,这完全取决于tryAcquire的实现(即取决于ReentrantLock当初是怎么构造的)。

    private boolean doAcquireNanos(int arg, long nanosTimeout)
            throws InterruptedException {
        if (nanosTimeout <= 0L)//如果时间小于0,直接返回失败
            return false;
        final long deadline = System.nanoTime() + nanosTimeout;//算出“死期”,当死期到了就直接返回失败了
        final Node node = addWaiter(Node.EXCLUSIVE);
        boolean failed = true;
        try {
            for (;;) {
                final Node p = node.predecessor();
                if (p == head && tryAcquire(arg)) {
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return true;
                }
                // 看看你的年龄是否到达了死期
                nanosTimeout = deadline - System.nanoTime();
                if (nanosTimeout <= 0L)//小于0,说明死期到了
                    return false;
                if (shouldParkAfterFailedAcquire(p, node) &&
                    nanosTimeout > spinForTimeoutThreshold)//剩余寿命得大于1ms
                    LockSupport.parkNanos(this, nanosTimeout);
                if (Thread.interrupted())
                    throw new InterruptedException();
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

将doAcquireNanos方法 与不响应中断的acquireQueued方法、响应中断的doAcquireInterruptibly方法进行对比,发现差别很少,简单的我用注释说明了。

  • 每次循环都会检查时间是否到达deadline。
  • 当剩余时间小于spinForTimeoutThreshold时,则不能调用LockSupport.parkNanos,因为时间太短,反而无法精确控制阻塞时间,所以不如在剩余的时间里一直循环。
  • LockSupport.parkNanos除了会因为别人的park而唤醒,也会因为别人的中断而唤醒,当然最重要的,时间到了,它自己会唤醒。
  • 不管哪种情况,被唤醒后,都会检查中断状态。每个循环都会检查一次。

7、只一次尝试的 非公平的 独占锁的获取

只一次尝试的、非公平的独占锁获得对ReentrantLock来说,是调用ReentrantLock.tryLock()。而nonfairTryAcquire方法就是之前讲过的非公平锁的获取方式。

//ReentrantLock.java
public boolean tryLock() {
        return sync.nonfairTryAcquire(1);
    }

    abstract static class Sync extends AbstractQueuedSynchronizer {
        ...
        final boolean nonfairTryAcquire(int acquires) {
            final Thread current = Thread.currentThread();
            int c = getState();
            if (c == 0) {
                if (compareAndSetState(0, acquires)) {
                    setExclusiveOwnerThread(current);
                    return true;
                }
            }
            else if (current == getExclusiveOwnerThread()) {
                int nextc = c + acquires;
                if (nextc < 0) // overflow
                    throw new Error("Maximum lock count exceeded");
                setState(nextc);
                return true;
            }
            return false;
        }
        ...
    }

8、总结

  • 对于独占锁,AQS的state代表代表锁的状态,为0代表没有线程持有锁,非0代表有线程持有了锁。
  • 获得了锁的线程会将自己设置为exclusiveOwnerThread。
  • addWaiter负责new出一个包装当前线程的node,enq负责将node添加到队尾,如果队尾为空,它还负责添加dummy node。
  • acquireQueued是整个获取锁过程的核心,这里是指它的那个死循环。一般情况下,每次循环做的事就是:尝试获取锁,获取锁失败,阻塞,被唤醒。如果某一次循环获取锁成功,那么之后会返回到用户代码调用处。
  • shouldParkAfterFailedAcquire负责自身的前驱节点的状态设置为SIGNAL,这样,当前驱节点释放锁时,会根据SIGNAL来唤醒自身。
  • parkAndCheckInterrupt最简单,用来阻塞当前线程。它也会去检查中断状态。

参考链接:https://blog.csdn.net/anlian523/article/details/106344926

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值