Redisson分布式锁的可重入、重试、续约机制原理

小树苗的野望

已于 2024-03-05 16:43:35 修改

阅读量5.4k

点赞数 47

文章标签：分布式

于 2024-03-05 16:39:03 首次发布

本文链接：https://blog.csdn.net/Shadow_T/article/details/136482891

版权

1. Redisson介绍

基于Redis的setnx实现的分布式锁存在下面的问题：

重入问题：重入问题是指获得锁的线程可以再次进入到相同的锁的代码块中，可重入锁的意义在于防止死锁，比如HashTable这样的代码中，他的方法都是使用synchronized修饰的，假如他在一个方法内，调用另一个方法，那么此时如果是不可重入的，就会导致死锁。所以可重入锁他的主要意义是防止死锁，Java中synchronized和Lock锁都是可重入的。
不可重试：获取锁失败的话不会自动重新尝试获取锁
超时释放：使用setnx实现的分布式锁通过添加过期时间可以防止死锁，但是如果线程堵塞的时间过长，会导致锁超时释放，可能会导致安全隐患。
主从一致性：如果Redis提供了主从集群，当我们向集群写数据时，主机需要异步的将数据同步给从机，而万一在同步过去之前，主机宕机了，就会出现死锁问题。

Redisson的概念：

Redisson是一个在Redis的基础上实现的Java驻内存数据网格（In-Memory Data Grid）。它不仅提供了一系列的分布式的Java常用对象，还提供了许多分布式服务，其中就包含了各种分布式锁的实现。

2. Redisson可重入锁的原理

在Lock锁中，底层有一个被voaltile修饰的state变量来记录重入的次数，如果当前没有人持有锁，则state=0，当有人获取到锁时，state设置为1，如果持有锁的人再次获取到同一把锁，则state的计数会加1。如果锁被释放了一次，则state的计数减1，直到state=0说明锁已经全部释放掉，无人持有。synchronized的底层逻辑也是类似。

在Redisson中，使用一个hash结构来存储锁，其中key表示该锁是否存在，field标识线程的持有者，value为锁的重入次数。

在RLock.tryLock()方法中判断锁的lua表达式如下：

"if (redis.call('exists', KEYS[1]) == 0) then " +   -- 判断锁是否已经存在
  "redis.call('hincrby', KEYS[1], ARGV[2], 1); " +  -- 如果锁不存在  创建一把新的锁并设置重入次数为1
  "redis.call('pexpire', KEYS[1], ARGV[1]); " +     -- 设置锁的过期时间
  "return nil; " +
"end; " +  
-- 如果锁已经存在 继续判断这把锁的field和自身的线程标识是否一致
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
  "redis.call('hincrby', KEYS[1], ARGV[2], 1); " +  -- 锁的重入次数+1
  "redis.call('pexpire', KEYS[1], ARGV[1]); " +     -- 刷新锁的超时时间
  "return nil; " +
"end; " +
-- 锁的field与自身线程标识不一致，说明锁已经被别人持有 返回锁的剩余时间
"return redis.call('pttl', KEYS[1]);"

其中的三个参数含义如下：

KEYS[1]：锁的名称
ARGV[1]：设置的锁的过期时间默认为30秒
ARGV[2]：id + “:” + threadId，锁的field

3. Redisson重试的原理

redisson在尝试获取锁的时候，如果传了时间参数，就不会在获取锁失败时立即返回失败，而是会进行重试。

waitTime：锁的最大重试时间
leaseTime：锁的释放时间，默认为-1，如果设置为-1，会触发看门狗机制，每过internalLockLeaseTime / 3 秒会续期，将锁设置为internalLockLeaseTime秒过期， internalLockLeaseTime默认为30，可通过setLockWatchdogTimeout()方法自定义
unit：时间单位

public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException {
    long time = unit.toMillis(waitTime);
    long current = System.currentTimeMillis();
    long threadId = Thread.currentThread().getId();
    // 尝试获取锁 获取失败会返回锁的ttl 成功返回null
    Long ttl = tryAcquire(waitTime, leaseTime, unit, threadId);
    // lock acquired  获取锁成功 直接返回 无需重试
    if (ttl == null) {
        return true;
    }
    // 获取锁失败判断一下设置的等待时间是否还有剩余
    time -= System.currentTimeMillis() - current;
    // 剩余时间小于0 则说明等待超时 不需要再重试 直接返回获取锁失败
    if (time <= 0) {
        acquireFailed(waitTime, unit, threadId);
        return false;
    }
    
    current = System.currentTimeMillis();
    // 订阅拿到锁的线程，该线程释放锁后会发布通知，其他锁得到消息就可以开始抢锁
    RFuture<RedissonLockEntry> subscribeFuture = subscribe(threadId);
    // 在time时间内等待订阅结果
    if (!subscribeFuture.await(time, TimeUnit.MILLISECONDS)) {
        // 如果time时间耗尽还未等到锁释放的消息 则尝试取消任务
        if (!subscribeFuture.cancel(false)) {
            subscribeFuture.onComplete((res, e) -> {
                if (e == null) {
                    // 取消任务失败则取消订阅任务
                    unsubscribe(subscribeFuture, threadId);
                }
            });
        }
        // 返回获取锁失败的消息
        acquireFailed(waitTime, unit, threadId);
        return false;
    }

    try {
        // 走到这里说明在超时时间内等到了锁释放的信号
        // 判断设定的等待时间是否还有剩余
        time -= System.currentTimeMillis() - current;
        if (time <= 0) {
            // 等待时间已经耗尽 直接返回获取锁失败的结果
            acquireFailed(waitTime, unit, threadId);
            return false;
        }
        // 循环尝试获取锁
        while (true) {
            long currentTime = System.currentTimeMillis();
            // 尝试获取锁 获取失败会返回锁的ttl 成功返回null
            ttl = tryAcquire(waitTime, leaseTime, unit, threadId);
            // lock acquired
            if (ttl == null) {
                // 获取到锁 直接返回
                return true;
            }
            // 获取锁失败 再次判断等待时间是否还有剩余
            time -= System.currentTimeMillis() - currentTime;
            if (time <= 0) {
                // 等待时间已经耗尽 直接返回获取锁失败的结果
                acquireFailed(waitTime, unit, threadId);
                return false;
            }

            // 等待时间还有剩余 继续尝试获取锁
            // waiting for message
            currentTime = System.currentTimeMillis();
            if (ttl >= 0 && ttl < time) {
                // 如果锁的剩余时间小于等待的时间，则在锁的剩余时间内等待锁的释放消息
                subscribeFuture.getNow().getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);
            } else {
                // 反之 则在剩余等待时间内 尝试获取锁释放的信号
                subscribeFuture.getNow().getLatch().tryAcquire(time, TimeUnit.MILLISECONDS);
            }
            // 再次判断等待时间是否还有剩余
            time -= System.currentTimeMillis() - currentTime;
            if (time <= 0) {
                // 返回获取锁失败
                acquireFailed(waitTime, unit, threadId);
                return false;
            }
        }
    } finally {
        unsubscribe(subscribeFuture, threadId);
    }
    //        return get(tryLockAsync(waitTime, leaseTime, unit));
}

Redisson锁的超时重试代码尝试在给定的等待时间内获取锁，通过订阅锁状态变化的方式实现异步等待，如果在等待过程中锁未能成功获取，则通过取消订阅和执行获取锁失败的操作进行超时处理。在获取锁后，通过循环不断尝试续租锁，同时在等待期间通过异步消息通知机制等待锁释放或续租成功，确保在给定的总等待时间内获取或续租锁，最终返回获取锁的成功或失败状态。

4. Redisson看门狗机制

如上文所说的，Redisson获取锁的方法tryLock中有个参数leaseTime，该参数定义了锁的超时时间，该值默认为-1，如果未设置leaseTime，会触发看门狗机制，每过internalLockLeaseTime / 3 秒会续期，将锁设置为internalLockLeaseTime秒过期， internalLockLeaseTime默认为30，可通过setLockWatchdogTimeout()方法自定义，话不多说，直接上源码。

private RFuture<Boolean> tryAcquireOnceAsync(long waitTime, long leaseTime, TimeUnit unit, long threadId) {
    if (leaseTime != -1) {
        // 如果leaseTime不为-1 则说明指定了锁的超时时间 直接获取锁然后返回
        return tryLockInnerAsync(waitTime, leaseTime, unit, threadId, RedisCommands.EVAL_NULL_BOOLEAN);
    }
    // 如果leaseTime为-1，则通过getLockWatchdogTimeout()方法获取锁的超时时间，也就是internalLockLeaseTime成员变量
    RFuture<Boolean> ttlRemainingFuture = tryLockInnerAsync(waitTime,
                                                            commandExecutor.getConnectionManager().getCfg().getLockWatchdogTimeout(),
                                                            TimeUnit.MILLISECONDS, threadId, RedisCommands.EVAL_NULL_BOOLEAN);
    // 获取锁的操作完成后调用
    ttlRemainingFuture.onComplete((ttlRemaining, e) -> {
        if (e != null) {
            return;
        }

        // lock acquired
        if (ttlRemaining) {
            // 如果获取到了锁，则开启一个定时任务为锁续约
            scheduleExpirationRenewal(threadId);
        }
    });
    return ttlRemainingFuture;
}
private void scheduleExpirationRenewal(long threadId) {
    // 创建一个新的续约entry
    ExpirationEntry entry = new ExpirationEntry();
    ExpirationEntry oldEntry = EXPIRATION_RENEWAL_MAP.putIfAbsent(getEntryName(), entry);
    if (oldEntry != null) {
        // key已经存在，说明是锁的重入 直接将线程id放入entry
        oldEntry.addThreadId(threadId);
    } else {
        // key不存在，说明是第一次获取到锁 将线程id放入entry 并开启定时任务续约
        entry.addThreadId(threadId);
        renewExpiration();
    }
}

// 续约逻辑
private void renewExpiration() {
    
    ExpirationEntry ee = EXPIRATION_RENEWAL_MAP.get(getEntryName());
    if (ee == null) {
        return;
    }
    //创建延时任务 在internalLockLeaseTime / 3毫秒之后执行
    Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
        @Override
        public void run(Timeout timeout) throws Exception {
            ExpirationEntry ent = EXPIRATION_RENEWAL_MAP.get(getEntryName());
            if (ent == null) {
                return;
            }
            Long threadId = ent.getFirstThreadId();
            if (threadId == null) {
                return;
            }
            // 在renewExpirationAsync方法中执行续约脚本重新将锁的过期时间设置为internalLockLeaseTime
            RFuture<Boolean> future = renewExpirationAsync(threadId);
            future.onComplete((res, e) -> {
                if (e != null) {
                    log.error("Can't update lock " + getName() + " expiration", e);
                    return;
                }

                if (res) {
                    // 续约成功 递归调用自己续约
                    renewExpiration();
                }
            });
        }
    }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
    // 将task与entry绑定 解锁的时候需要用来取消任务
    ee.setTimeout(task);
}