文章目录
问题引入
某电商平台要对某商品(例如商品 sk:0008)进行秒杀销售。假设参与秒杀的商品数量
amount 为 1000 台,每个账户只允许抢购一台,即每个请求只会减少一台库存。
分析
上述代码是有问题的。既然是秒杀,那么一定是高并发场景,且生产环境下,该应用一
定是部署在一个集群中的。如果参与秒杀的用户数量特别巨大,那么一定会存在很多用户同时读取 Redis 缓存中的 sk:0008 这个 key,那么大家读取到的 value 很可能是相同的,均大于零,均可购买。此时就会出现“超卖”。即,以上代码存在并发问题。
setnx 实现方式
为了解决上述代码中的并发问题,可以使用 Redis 实现的分布式锁。
该实现方式主要是通过 setnx 命令完成的。其基本原理是,setnx 只有在指定 key 不存在
时才能执行成功,分布式系统中的哪个节点抢先成功执行了 setnx,谁就抢到了锁,谁就拥有了对共享资源的操作权限。当然,其它节点只能等待锁的释放。一旦拥有锁的节点对共享资源操作完毕,其就可以主动删除该 key,即释放锁。然后其它节点就可重新使用 setnx 命令抢注该 key,即抢注锁。
实现
首先在 Controller 类中添加一个 String 常量,作为 Redis 锁的 key。
然后复制 seckillHandler()方法并重命名为 seckillHandler2(),然后修改代码。
问题
若处理当前请求的 APP 节点主机在执行完“添加锁”语句后突然宕机,其 finally 中的释
放锁代码根本就没有执行,那么,其它客户端通过其它 APP 节点主机申请资源时,将会由于无法获得到锁而永久性阻塞。
为锁添加过期时间
为了解决前述方式中存在的问题,可以为锁添加过期时间,这样就不会出现锁被某节点
主机永久性占用的情况,即不会出现节点被永久性阻塞的情况。
不过,为 key 添加过期时间的方式有两种:一种是通过 expire 命令为 key 指定过期时间,还有一种是在 setnx 命令中直接给出该 key 的过期时间。第一种方式中 setnx 与 expire 命令是分别执行的,不具备原子性,仍然可能会出现问题。而第二种方式则是直接在 setnx 中完成了两步操作,具有原子性。故,应采用第二种方式。
问题
上述代码中为锁指定的过期时间为 5 秒,如果 seckillHandler3()方法的业务逻辑比较复杂,需要调用其它微服务处理。如果请求 a 的处理时间超过了 5 秒(假设 6 秒),而当 5 秒钟过去后,这个锁自动过期了。由于锁已过期,另一个请求 b 通过 setnx 申请到了锁。此时如果耗时 6 秒的请求 a 处理完了,回来继续执行程序,请求 a 就会把请求 b 设置的锁给删除了。此时其它请求就可申请到锁,并与请求 b 同时访问共享资源,很可能会引发数据的不一致。这是个很严重的问题。
为锁添加标识
上述代码只所以会出现那种锁被误删的情况,主要是因为所有客户端添加的锁的 value
值完全相同,而我们想要的效果是“谁添加的锁,该锁只能由谁来删”。
这种自己加的锁可以被其它进程给删除的情况,是不符合 Java 中的 Lock 规范的。Java 中的Lock 规范要求,谁加的锁,就只能由谁解锁。
为了实现这个效果,为每个申请锁的客户端随机生成一个 UUID,使用这个 UUID 作为该
客户端标识,然后将该 UUID 作为该客户端申请到的锁的 value。在删除锁时,只有在发起当前删除操作的客户端的 UUID 与锁的 value 相同时才可以。
问题
在 finally{}中对于删除锁的客户端身份的判断与删除锁操作是两个语句,不具有原子性,
在并发场景下可能会出问题。
例如,客户端 a 在节点主机 A 中添加了锁后,执行业务逻辑用时 6 秒,此时锁已过期,
然后执行到了 finally{}中的判断,并判断结果为真,然后时间片到了,暂停执行。
由于节点主机 A 中的锁已经过期,客户端 b 在节点主机 B 中添加锁成功,然后很快执
行到了业务逻辑(未超过锁的过期时间),此时客户端 b 的处理进程时间片到了。
此时主机 A 中的代码又获得了处理机,继续执行。此时就会执行对锁的删除语句,删除
成功。也就是说主机 A 删除了由主机 B 添加的锁。这就是很严重的问题。
添加 Lua 脚本
对客户端身份的判断与删除锁操作的合并,是没有专门的原子性命令的。此时可以通过
Lua 脚本来实现它们的原子性。而对 Lua 脚本的执行,可以通过 eval 命令来完成。
不过,eval 命令在 RedisTemplate 中没有对应的方法,而 Jedis 中具有该同名方法。所以,需要在代码中首先获取到 Jedis 客户端,然后才能调用 jedis.eval()。
问题
以上代码仍然是存在问题的:请求 a 的锁过期,但其业务还未执行完毕;请求 b 申请到
了锁,其也正在处理业务。如果此时两个请求都同时修改了共享的库存数据,那么就又会出现数据不一致的问题,即仍然存在并发问题。在高并发场景下,问题会被无限放大。
对于该问题,可以采用“锁续约”方式解决。即,在当前业务进程开始执行时,fork 出
一个子进程,用于启动一个定时任务。该定时任务的定时时间小于锁的过期时间,其会定时查看处理当前请求的业务进程的锁是否已被删除。如果已被删除,则子进程结束;如果未被删除,说明当前请求的业务还未处理完毕,则将锁的时间重新设置为“原过期时间”。这种方式称为锁续约,也称为锁续命。
Redisson 可重入锁
使用 Redisson 的可重入锁可以解决上述问题。
Redisson 内部使用 Lua 脚本实现了对可重入锁的添加、重入、续约(续命)、释放。Redisson需要用户为锁指定一个 key,但无需为锁指定过期时间,因为它有默认过期时间(当然,也可指定)。由于该锁具有“可重入”功能,所以 Redisson 会为该锁生成一个计数器,记录一个线程重入锁的次数。 hash -> field
在 Application 中添加一个由单 Redis 节点构建的 Redisson 的 Bean。
问题
在 Redis 单机情况下,以上代码是没有问题的。但如果是在 Redis 主从集群中,那么其
还存在锁丢失问题。
在 Redis 主从集群中,假设节点 A 为 master,节点 B、C 为 slave。如果一个请求 a 在处理时申请锁,即向节点 A 添加一个 key。当节点 A 收到请求后写入 key 成功,然后会立即向处理 a 请求的应用服务器 Sa 响应,然后会向 slave 同步该 key。不过,在同步还未开始时,节点 A 宕机,节点 B 晋升为 master。此时正好有一个请求 b 申请锁,由于节点 B 中并没有该 key,所以该 key 写入成功,然后会立即向处理 b 请求的应用服务器 Sb 响应。由于 Sa 与Sb 都收到了 key 写入成功的响应,所以它们都可同时对共享数据进行处理。这就又出现了并发问题。
之所以新的 master 节点 B 同意请求 b 的锁申请,是因为主从集群丢失了请求 a 的锁申
请,即对于节点 B 来说,其根本就不知道有过请求 a 的锁申请。所以,该问题称为主从集群的锁丢失问题。
Redisson 红锁
Redisson 红锁可以防止主从集群锁丢失问题。Redisson 红锁要求,必须要构建出至少三
个 Redis 主从集群。若一个请求要申请锁,必须向所有主从集群中提交 key 写入请求,只有当大多数集群锁写入成功后,该锁才算申请成功。
修改启动类 Application
我们这里要使用三个高可用的 Redis 主从集群,所以需要在启动类中添加三个 Sentinel
集群构建的 Redisson 的 Bean。由于这三个 Bean 将来要使用 byName 注入方式,所以这里为每个 Bean 指定了一个名称。
在类中添加 Redisson 的 byName 方式的自动注入。
复制 seckillHandler6()方法并重命名为 seckillHandler7(),然后仅修改锁创建代码,其它
代码不变。
问题
无论前面使用的是哪种锁,它们解决并发问题的思路都是相同的,那就将所有请求通过
锁实现串行化。而串行化在高并发场景下势必会引发性能问题。
分段锁
解决锁的串行化引发的性能问题的方案就是,使访问并行化。将要共享访问的一个资源,拆分为多个共享访问资源,这样就会将一把锁的需求转变为多把锁,实现并行化。
例如,对于秒杀商品 sk:0008,其有 1000 件。现在将其拆分为 10 份,每份 100 件。即
将秒杀商品变为了 10 件,分别为 sk:0008:01,sk:0008:02,sk:0008:03,„„,sk:0008:10。
这样的话,就需要 10 把锁来控制所有请求的并发。由原来的因为只有一把锁而导致的每个时刻只能处理 1 个请求,变为了现在有了 10 把锁,每个时刻可以同时处理 10 个请求。并发提高了 10 倍。
Redisson 详解
Redisson 是一个在 Redis 的基础上实现的 Java 驻内存数据网格(In-Memory Data Grid)。它不仅提供了一系列的分布式的 Java 常用对象,还提供了许多分布式服务。
Redisson 底层采用的是 Netty 框架。
在生产中,对于 Redisson 使用最多的场景就是其分布式锁 RLock。当然,RLock 仅仅是Redisson 的线程同步方案之一。
Redisson 提供了 8 种线程同步方案,用户可针对不同场景选用不同方案。
需要注意的是,为了避免锁到期但业务逻辑没有执行完毕而引发的多个线程同时访问共享资源的情况发生,Redisson 内部为锁提供了一个监控锁的看门狗 watch dog,其会在锁到期前不断延长锁的到期时间,直到锁被主动释放。即会自动完成“锁续命”。
可重入锁
Redisson 的分布式锁 RLock 是一种可重入锁。当一个线程获取到锁之后,这个线程可以
再次获取本对象上的锁,而其他的线程是不可以的。
- JDK 中的 ReentrantLock 是可重入锁,其是通过 AQS(抽象队列同步器)实现的锁机制
- synchronized 也是可重入锁,其是通过监视器模式(本质是 OS 的互斥锁)实现的锁机制
公平锁
Redisson 的可重入锁 RLock 默认是一种非公平锁,但也支持可重入公平锁 FailLock。当
有多个线程同时申请锁时,这些线程会进入到一个 FIFO 队列,只有队首元素才会获取到锁,其它元素等待。只有当锁被释放后,才会再将锁分配给当前的队首元素。
联锁
Redisson 分布式锁可以实现联锁 MultiLock。当一个线程需要同时处理多个共享资源时,可使用联锁。即一次性申请多个锁,同时锁定多个共享资源。联锁可预防死锁。相当于对共享资源的申请实现了原子性:要么都申请到,只要缺少一个资源,则将申请到的所有资源全部释放。其是 OS 底层原理中 AND 型信号量机制的典型应用。
红锁
Redisson 分布式锁可以实现红锁 RedLock。红锁由多个锁构成,只有当这些锁中的大部
分锁申请成功时,红锁才申请成功。红锁一般用于解决 Redis 主从集群锁丢失问题。
红锁与联锁的区别是,红锁实现的是对一个共享资源的同步访问控制,而联锁实现的是
多个共享资源的同步访问控制。
读写锁
通过 Redisson 可以获取到读写锁 RReadWriteLock。通过 RReadWriteLock 实例可分别获取到读锁 RedissonReadLock 与写锁 RedissonWriteLock。
读锁与写锁分别是实现了 RLock 的可重入锁。
一个共享资源,在没有写锁的情况下,允许同时添加多个读锁。只要添加了写锁,任何读锁与写锁都不能再次添加。即读锁是共享锁
,写锁为排他锁
。
信号量
通过Redisson可以获取到信号量RSemaphore。RSemaphore的常用场景有两种:
一种是,无论谁添加的锁,任何其它线程都可以解锁,就可以使用 RSemaphore。
另外,当一个线程需要一次申请多个资源时,可使用 RSemaphore。RSemaphore 是信号量机制的典型应用。
可过期信号量
通过 Redisson 可以获取到可过期信号量 PermitExpirableSemaphore。该信号量是在
RSemaphore 基础上,为每个信号增加了一个过期时间,且每个信号都可以通过==独立的 ID ==来辨识。释放时也只能通过提交该 ID 才能释放。
不过,一个线程每次只能申请一个信号量,当然每次了只会释放一个信号量。这是与
RSemaphore 不同的地方。该信号量为互斥信号量时,其就等同于可重入锁。或者说,可重入锁就相当于信号量为1 的可过期信号量。
注意,可过期信号量与可重入锁的区别
:
- 可重入锁:相当于用户每次只能申请 1 个信号量,且只有一个用户可以申请成功
- 可过期信号量:用户每次只能申请 1 个信号量,但可以有多个用户申请成功
分布式闭锁
通过 Redisson 可以获取到分布式闭锁 RCountDownLatch,其与 JDK 的 JUC 中的闭锁
CountDownLatch 原理相同,用法类似。其常用于一个或者多个线程的执行必须在其它某些任务执行完毕的场景。例如,大规模分布式并行计算中,最终的合并计算必须基于很多并行计算的运行完毕。
闭锁中定义了一个计数器和一个阻塞队列。阻塞队列中存放着待执行的线程。每当一个
并行任务执行完毕,计数器就减 1。当计数器递减到 0 时就会唤醒阻塞队列的所有线程。通常使用 Barrier 队列解决该问题,而 Barrier 队列通常使用 Zookeeper 实现。