基于Redis实现分布式锁

最新推荐文章于 2023-06-15 12:04:45 发布

golden_lion

最新推荐文章于 2023-06-15 12:04:45 发布

阅读量1.4k

点赞数

分类专栏： redis

redis 专栏收录该内容

46 篇文章 0 订阅

订阅专栏

背景
 在很多互联网产品应用中，有些场景需要加锁处理，比如：秒杀，全局递增ID，楼层生成等等。大部分的解决方案是基于DB实现的，Redis为单进程单线程模式，采用队列模式将并发访问变成串行访问，且多客户端对Redis的连接并不存在竞争关系。其次Redis提供一些命令SETNX，GETSET，可以方便实现分布式锁机制。
Redis命令介绍
 使用Redis实现分布式锁，有两个重要函数需要介绍
 
 SETNX命令（SET if Not eXists）
 语法：
 SETNX key value
 功能：
 当且仅当 key 不存在，将 key 的值设为 value ，并返回1；若给定的 key 已经存在，则 SETNX 不做任何动作，并返回0。
GETSET命令
 语法：
 GETSET key value
 功能：
 将给定 key 的值设为 value ，并返回 key 的旧值 (old value)，当 key 存在但不是字符串类型时，返回一个错误，当key不存在时，返回nil。
GET命令
 语法：
 GET key
 功能：
 返回 key 所关联的字符串值，如果 key 不存在那么返回特殊值 nil 。
DEL命令
 语法：
 DEL key [KEY …]
 功能：
 删除给定的一个或多个 key ,不存在的 key 会被忽略。
兵贵精，不在多。分布式锁，我们就依靠这四个命令。但在具体实现，还有很多细节，需要仔细斟酌，因为在分布式并发多进程中，任何一点出现差错，都会导致死锁，hold住所有进程。
加锁实现
SETNX 可以直接加锁操作，比如说对某个关键词foo加锁，客户端可以尝试
 SETNX foo.lock <current unix time>
如果返回1，表示客户端已经获取锁，可以往下操作，操作完成后，通过
 DEL foo.lock
命令来释放锁。
 如果返回0，说明foo已经被其他客户端上锁，如果锁是非堵塞的，可以选择返回调用。如果是堵塞调用调用，就需要进入以下个重试循环，直至成功获得锁或者重试超时。理想是美好的，现实是残酷的。仅仅使用SETNX加锁带有竞争条件的，在某些特定的情况会造成死锁错误。
处理死锁
在上面的处理方式中，如果获取锁的客户端端执行时间过长，进程被kill掉，或者因为其他异常崩溃，导致无法释放锁，就会造成死锁。所以，需要对加锁要做时效性检测。因此，我们在加锁时，把当前时间戳作为value存入此锁中，通过当前时间戳和Redis中的时间戳进行对比，如果超过一定差值，认为锁已经时效，防止锁无限期的锁下去，但是，在大并发情况，如果同时检测锁失效，并简单粗暴的删除死锁，再通过SETNX上锁，可能会导致竞争条件的产生，即多个客户端同时获取锁。
C1获取锁，并崩溃。C2和C3调用SETNX上锁返回0后，获得foo.lock的时间戳，通过比对时间戳，发现锁超时。
 C2 向foo.lock发送DEL命令。
 C2 向foo.lock发送SETNX获取锁。
 C3 向foo.lock发送DEL命令，此时C3发送DEL时，其实DEL掉的是C2的锁。
 C3 向foo.lock发送SETNX获取锁。
此时C2和C3都获取了锁，产生竞争条件，如果在更高并发的情况，可能会有更多客户端获取锁。所以，DEL锁的操作，不能直接使用在锁超时的情况下，幸好我们有GETSET方法，假设我们现在有另外一个客户端C4，看看如何使用GETSET方式，避免这种情况产生。
C1获取锁，并崩溃。C2和C3调用SETNX上锁返回0后，调用GET命令获得foo.lock的时间戳T1，通过比对时间戳，发现锁超时。
 C4 向foo.lock发送GESET命令，
 GETSET foo.lock <current unix time>
 并得到foo.lock中老的时间戳T2
如果T1=T2，说明C4获得时间戳。
 如果T1!=T2，说明C4之前有另外一个客户端C5通过调用GETSET方式获取了时间戳，C4未获得锁。只能sleep下，进入下次循环中。
现在唯一的问题是，C4设置foo.lock的新时间戳，是否会对锁产生影响。其实我们可以看到C4和C5执行的时间差值极小，并且写入foo.lock中的都是有效时间错，所以对锁并没有影响。
 为了让这个锁更加强壮，获取锁的客户端，应该在调用关键业务时，再次调用GET方法获取T1，和写入的T0时间戳进行对比，以免锁因其他情况被执行DEL意外解开而不知。以上步骤和情况，很容易从其他参考资料中看到。客户端处理和失败的情况非常复杂，不仅仅是崩溃这么简单，还可能是客户端因为某些操作被阻塞了相当长时间，紧接着 DEL 命令被尝试执行(但这时锁却在另外的客户端手上)。也可能因为处理不当，导致死锁。还有可能因为sleep设置不合理，导致Redis在大并发下被压垮。最为常见的问题还有
GET返回nil时应该走那种逻辑？
第一种走超时逻辑
 C1客户端获取锁，并且处理完后，DEL掉锁，在DEL锁之前。C2通过SETNX向foo.lock设置时间戳T0 发现有客户端获取锁，进入GET操作。
 C2 向foo.lock发送GET命令，获取返回值T1(nil)。
 C2 通过T0>T1+expire对比，进入GETSET流程。
 C2 调用GETSET向foo.lock发送T0时间戳，返回foo.lock的原值T2
 C2 如果T2=T1相等，获得锁，如果T2!=T1，未获得锁。
第二种情况走循环走setnx逻辑
 C1客户端获取锁，并且处理完后，DEL掉锁，在DEL锁之前。C2通过SETNX向foo.lock设置时间戳T0 发现有客户端获取锁，进入GET操作。
 C2 向foo.lock发送GET命令，获取返回值T1(nil)。
 C2 循环，进入下一次SETNX逻辑
两种逻辑貌似都是OK，但是从逻辑处理上来说，第一种情况存在问题。当GET返回nil表示，锁是被删除的，而不是超时，应该走SETNX逻辑加锁。走第一种情况的问题是，正常的加锁逻辑应该走SETNX，而现在当锁被解除后，走的是GETST，如果判断条件不当，就会引起死锁，很悲催，我在做的时候就碰到了，具体怎么碰到的看下面的问题
GETSET返回nil时应该怎么处理？
C1和C2客户端调用GET接口，C1返回T1，此时C3网络情况更好，快速进入获取锁，并执行DEL删除锁，C2返回T2(nil)，C1和C2都进入超时处理逻辑。
 C1 向foo.lock发送GETSET命令，获取返回值T11(nil)。
 C1 比对C1和C11发现两者不同，处理逻辑认为未获取锁。
 C2 向foo.lock发送GETSET命令，获取返回值T22(C1写入的时间戳)。
 C2 比对C2和C22发现两者不同，处理逻辑认为未获取锁。
此时C1和C2都认为未获取锁，其实C1是已经获取锁了，但是他的处理逻辑没有考虑GETSET返回nil的情况，只是单纯的用GET和GETSET值就行对比，至于为什么会出现这种情况？一种是多客户端时，每个客户端连接Redis的后，发出的命令并不是连续的，导致从单客户端看到的好像连续的命令，到Redis server后，这两条命令之间可能已经插入大量的其他客户端发出的命令，比如DEL,SETNX等。第二种情况，多客户端之间时间不同步，或者不是严格意义的同步。
时间戳的问题
我们看到foo.lock的value值为时间戳，所以要在多客户端情况下，保证锁有效，一定要同步各服务器的时间，如果各服务器间，时间有差异。时间不一致的客户端，在判断锁超时，就会出现偏差，从而产生竞争条件。
 锁的超时与否，严格依赖时间戳，时间戳本身也是有精度限制，假如我们的时间精度为秒，从加锁到执行操作再到解锁，一般操作肯定都能在一秒内完成。这样的话，我们上面的CASE，就很容易出现。所以，最好把时间精度提升到毫秒级。这样的话，可以保证毫秒级别的锁是安全的。
分布式锁的问题
1：必要的超时机制：获取锁的客户端一旦崩溃，一定要有过期机制，否则其他客户端都降无法获取锁，造成死锁问题。
 2：分布式锁，多客户端的时间戳不能保证严格意义的一致性，所以在某些特定因素下，有可能存在锁串的情况。要适度的机制，可以承受小概率的事件产生。
 3：只对关键处理节点加锁，良好的习惯是，把相关的资源准备好，比如连接数据库后，调用加锁机制获取锁，直接进行操作，然后释放，尽量减少持有锁的时间。
 4：在持有锁期间要不要CHECK锁，如果需要严格依赖锁的状态，最好在关键步骤中做锁的CHECK检查机制，但是根据我们的测试发现，在大并发时，每一次CHECK锁操作，都要消耗掉几个毫秒，而我们的整个持锁处理逻辑才不到10毫秒，玩客没有选择做锁的检查。
 5：sleep学问，为了减少对Redis的压力，获取锁尝试时，循环之间一定要做sleep操作。但是sleep时间是多少是门学问。需要根据自己的Redis的QPS，加上持锁处理时间等进行合理计算。
 6：至于为什么不使用Redis的muti，expire，watch等机制，可以查一参考资料，找下原因。
锁测试数据
未使用sleep
 第一种，锁重试时未做sleep。单次请求，加锁，执行，解锁时间 
 
 
 可以看到加锁和解锁时间都很快，当我们使用
ab -n1000 -c100 'http://sandbox6.wanke.etao.com/test/test_sequence.php?tbpm=t'
 AB 并发100累计1000次请求，对这个方法进行压测时。 
 
 
 我们会发现，获取锁的时间变成，同时持有锁后，执行时间也变成，而delete锁的时间，将近10ms时间，为什么会这样？
 1：持有锁后，我们的执行逻辑中包含了再次调用Redis操作，在大并发情况下，Redis执行明显变慢。
 2：锁的删除时间变长，从之前的0.2ms，变成9.8ms，性能下降近50倍。
 在这种情况下，我们压测的QPS为49，最终发现QPS和压测总量有关，当我们并发100总共100次请求时，QPS得到110多。当我们使用sleep时
使用Sleep时
单次执行请求时
 
 
我们看到，和不使用sleep机制时，性能相当。当时用相同的压测条件进行压缩时 
 
 
获取锁的时间明显变长，而锁的释放时间明显变短，仅是不采用sleep机制的一半。当然执行时间变成就是因为，我们在执行过程中，重新创建数据库连接，导致时间变长的。同时我们可以对比下Redis的命令执行压力情况 
 
 上图中细高部分是为未采用sleep机制的时的压测图，矮胖部分为采用sleep机制的压测图，通上图看到压力减少50%左右，当然，sleep这种方式还有个缺点QPS下降明显，在我们的压测条件下，仅为35，并且有部分请求出现超时情况。不过综合各种情况后，我们还是决定采用sleep机制，主要是为了防止在大并发情况下把Redis压垮，很不行，我们之前碰到过，所以肯定会采用sleep机制。
参考资料
http://www.worlduc.com/FileSystem/18/2518/590664/9f63555e6079482f831c8ab1dcb8c19c.pdf
 http://redis.io/commands/setnx
 http://www.blogjava.net/caojianhua/archive/2013/01/28/394847.html
 
   
   
   
   
   
   
 
 
   
   
     顶 
    
   
     8 
    
   
   
   
     踩 
    
   
     0 
    
   
 
 
    
 
 
    
 
 上一篇躺坑了，self.navigationController.navigationBar setTranslucent:YES
 下一篇查看CPU信息

 
  参考知识库 
 
   MySQL知识库 8483关注|1396收录

猜你在找

高并发之Redis初级

深入浅出MySQL入门必备

Android开发精品课程【Java核心知识】

Git入门基础

Java之路

用Redis实现分布式锁

用 Redis 实现分布式锁

使用 Redis 实现分布式锁

Redis 的分布式锁的实现

分布式锁实现基于redis

 
  查看评论 
   
     10楼  
    江东槐树下 前天 14:09发表 [回复] 
    
     如果是堵塞调用调用，就需要进入以下个重试循环 
    
 是自己写循环么，其实默认是非阻塞，对不对 
    
     9楼  
    云姐 2016-04-15 14:12发表 [回复] 
    
     学习了。 
    
     8楼  
    wujiangli2008 2016-02-24 18:18发表 [回复] 
    
     http://redis.io/topics/distlock 
    
     7楼  
    baidu_33891779 2016-01-30 16:48发表 [回复] 
    
     或者更简单一点， 获取锁用setnx， 锁超期失效的情况由expire来处理， 就是setnx成功获取到锁以后， 紧接着设置这个锁键的过期时间， 这样超时以后， 就会有redis直接删除这个key， 其他进程只需要循环setnx获取锁就好了 
     
       Re:  
      逸学堂 2016-02-16 18:04发表 [回复] 
      
       回复baidu_33891779：正常逻辑没有问题，边界情况处理不对，并且如果所有的锁释放依赖超时时间，那么失去了锁本身含义。锁应该用时获取，不用时释放，不能获得锁后，等待锁自己的超时释放。 
      
     6楼  
    baidu_33891779 2016-01-30 16:45发表 [回复] 
    
     楼主这个逻辑有点复杂啊， 我觉得这样是不是会简单点：A获取锁用SETNX，某时刻A崩溃没有及时释放锁， B，C同时检测到这个锁超时， 关键就是这个下面DEL的问题， 要保证只有一个能顺利执行DEL，那么B,C同时在通过 SETNX 获取另一个锁（删除锁）， 谁获得了， 谁DEL， 没获得的直接下一次循环， 获得锁的进程执行完DEL以后立即释放删除锁。楼主看看这个如何， 能满足你的要求吧。 哈哈， 第一次回复别人的技术贴~~ 
    
     5楼  
    gaohongtianluck 2015-12-07 15:12发表 [回复] 
    
     忽略了一个地方。用del命令释放锁，如果线程A获得锁之后运行太久，久到另已经获得的锁失效了。这时线程B进来，取缔了A上的锁，线程B运行到一半的时候，这时线程A也运行完了，杀一个回马枪把原本以为获取到的锁给del，实际上是B获得的锁，那么就会导致其他线程进来竞争，而B还以为自己独占锁。 
     
       Re:  
      逸学堂 2016-02-16 18:09发表 [回复] 
      
       回复gaohongtianluck：是的，一旦锁出现超时，可能会出现这样的编辑情况。我们的方式1：这不是一个严格意义的锁，有可能会存在两个进程并发执行的情况，程序要做好这方面的容错。2：减小锁的力度，不能业务和场景下分别创建独立的小锁，锁内的处理流程尽可能的短。 
      
       Re:  
      阿奴波仔 2015-12-26 15:41发表 [回复] 
      
       回复gaohongtianluck：我也在思考这个问题，我觉得有一种写法可以尽量避免。在锁的时候，如果锁住了，回传超时时间，作为解锁时候的凭证，解锁时传入锁的键值和凭证。我思考的解锁时候有两种写法：1、解锁前get一下键值的value，判断是不是和自己的凭证一样。但这样存在一些问题： 1）get时返回nil的可能，此时表示有别的线程拿到锁并用完释放 2）get返回非nil，但是不等于自身凭证。由于有getset那一步，当两个竞争线程都在这个过程中时，存在持有锁的线程凭证不等于value，而是value是稍慢那一步线程设置的value。2、解锁前用凭证判断锁是否已经超时，如果没有超时，直接删除；如果超时，等着锁自动过期就好，免得误删别人的锁。但这种写法同样存在问题，由于线程调度的不确定性，判断到删除之间可能过去很久，并不是绝对意义上的正确解锁。关于解锁我只想到这么多，希望有帮助，欢迎拍砖多交流。 
      
     4楼  
    风雪无殇 2015-11-09 14:18发表 [回复] 
    
     附上流程图 会比文字描述更具象。 
    
     3楼  
    shenmdouyourenjiaole 2015-09-10 16:43发表 [回复] 
    
     第二种情况走循环走setnx逻辑 
    
 C1客户端获取锁，并且处理完后，DEL掉锁，在DEL锁之前。C2通过SETNX向foo.lock设置时间戳T0 发现有客户端获取锁，进入GET操作。 
    
 C2 向foo.lock发送GET命令，获取返回值T1(nil)。 
    
 C2 循环，进入下一次SETNX逻辑 
    
 这儿有点儿不太明白，如果C2获取的返回值是nil，则直接就可以执行setnx了吧，为什么还要走 循坏呢？ 
    
     2楼  
    逸学堂 2015-07-23 09:35发表 [回复] 
    
     设置默认失效时间是两步操作，你需要先set内容后再设置超时时间。两步操作，在分布式操作中有可能中断，如果你set后还没有来得及设置expire，那么设置进去的key将永远不会释放了。 
     
       Re:  
      Liusp 2016-01-27 09:24发表 [回复] 
      
       回复逸学堂：直接执行setnx也不一定能竞争到锁，所以循环到一直拿到锁为止 
      
     1楼  
    个人渣记录仅为自己搜索用 2015-06-16 01:02发表 [回复] [引用] [举报] 
    
     6：至于为什么不使用Redis的muti，expire，watch等机制，可以查一参考资料，找下原因。 
    
 为啥不用redis默认的失效时间呢? 
     
       Re:  
      风雪无殇 2015-11-09 15:57发表 [回复] [引用] [举报] 
      
       回复个人渣记录仅为自己搜索用：个人认为，其实 watch 也不能单独使用，因为很多时候不能一次执行操作不成功就放弃的，只要组织一系列符合条件的操作即可。

golden_lion

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
基于Redis实现分布式锁

背景在很多互联网产品应用中，有些场景需要加锁处理，比如：秒杀，全局递增ID，楼层生成等等。大部分的解决方案是基于DB实现的，Redis为单进程单线程模式，采用队列模式将并发访问变成串行访问，且多客户端对Redis的连接并不存在竞争关系。其次Redis提供一些命令SETNX，GETSET，可以方便实现分布式锁机制。Redis命令介绍使用Redis实现分布式锁，有两个重要函数需要介绍
复制链接

扫一扫