好久没写博客了,突然想起来以前看老外博客上redis做分布式锁的想法。
实现一个DLM(distributed lock manager)主要需要考虑一下几个问题:
- lock server本身需要是高可用的,如果是多个节点,需要保证2n+1个节点只要n+1个节点可用则服务可用
- 分布式系统里,申请lock的client可能会宕机,因此每个锁,必须有一个expire时间,系统可以回收
- .防止死锁,就是多个client同时来申请(race-condition),如果此时有资源,必须保证有人能申请到
用多个redis节点来解决这个问题的思路就来了
- 首先redis支持add原子操作,对于每个redis实例,add一个key,若key存在则失败,若不存在则添加并成功
- redis每个实例都是单线程,不存在并发冲突,也就是不同client的add请求,redis都一个严格的执行序列
假设有2n+1个redis,以一个key作为lock的ID
申请锁:
- client向2n+1个redis执行add key的操作;
- 若有n+1个返回成功,则表示lock成功;
- 向所有成功的redis发送expire请求,设置一个超时时间;
- 对于申请不成功的redis还要做重试(防止其他人申请锁时把这个reids占用)
- 如果返回成功少于n+1,则先向自己申请成功的redis发送del请求,然后自己sleep随机值;
其实,向某个redis做add的动作,就是类似信号量里面的P操作,每个redis的占用一个key,就类似占用的一个信号量资源。至于解锁,重试,这些细节先不考虑了,基本原理如上。用到DLM的分布式系统,印象中lustre是有的。
redis现在功能好多,订阅发布,geo,hyperloglog,还能支持lua。redis的geo支持R-tree么,cluster版本是否支持分布式的R-tree?有了lua,redis的计算能力提升了,lua可以类似dbms的sql来用。