分布式锁的实现,目前比较常用的有以下几种方案:
- 基于数据库实现分布式锁;
- 基于缓存(Redis,memcached)实现分布式锁;
- 基于Zookeeper实现分布式锁。
分布式锁的要求:
- 可以保证在分布式部署的应用集群中,同一个方法在同一时间只能被一台机器上的一个线程执行。
- 具备锁失效机制,防止死锁;
- 具备非阻塞锁特性,即没有获取到锁将直接返回获取锁失败;
- 高可用的获取锁和释放锁功能;
- 高性能的获取锁和释放锁;
- 公平锁,按照请求加锁的顺序获得锁,非公平锁就相反是无序的。
基于数据库表实现分布式锁
在数据库中创建一个表,表中包含方法名等字段,并在方法名字段上创建唯一索引,想要执行某个方法,就使用这个方法名向表中插入数据,成功插入则获取锁,执行完成后删除对应的行数据释放锁。
创建表
CREATE TABLE `method_lock` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
`method_name` varchar(64) NOT NULL COMMENT '锁定的方法名',
`desc` varchar(255) NOT NULL COMMENT '备注信息',
`update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`),
UNIQUE KEY `uidx_method_name` (`method_name`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='锁定中的方法';
想要执行某个方法,就使用这个方法名向表中插入数据:
INSERT INTO method_lock (method_name, desc) VALUES ('方法名', '备注');
因为我们对method_name
做了唯一性约束,这里如果有多个请求同时提交到数据库的话,数据库会保证只有一个操作可以成功,那么我们就可以认为操作成功的那个线程获得了该方法的锁,可以执行方法体内容。
成功插入则获取锁,执行完成后删除对应的行数据释放锁:
delete from method_lock where method_name ='方法名';
可能存在的问题:
- 这把锁强依赖数据库的可用性,数据库是一个单点,一旦数据库挂掉,会导致业务系统不可用。
- 这把锁没有失效时间,一旦解锁操作失败,就会导致锁记录一直在数据库中,其他线程无法再获得到锁。
- 这把锁只能是非阻塞的,因为数据的insert操作,一旦插入失败就会直接报错。没有获得锁的线程并不会进入排队队列,要想再次获得锁就要再次触发获得锁操作。
- 这把锁是非重入的,同一个线程在没有释放锁之前无法再次获得该锁。因为数据中数据已经存在了。
解决方案:
- 数据库是单点?搞两个数据库,数据之前双向同步。一旦挂掉快速切换到备库上。
- 没有失效时间?只要做一个定时任务,每隔一定时间把数据库中的超时数据清理一遍。
- 非阻塞的?搞一个while循环,直到insert成功再返回成功。
- 非重入的?在数据库表中加个字段,记录当前获得锁的机器的主机信息和线程信息,那么下次再获取锁的时候先查询数据库,如果当前机器的主机信息和线程信息在数据库可以查到的话,直接把锁分配给他就可以了。
总结:
- 适用场景:MySQL 分布式锁一般适用于资源不存在数据库,如果数据库存在比如订单,可以直接对这条数据加行锁,不需要我们上面多的繁琐的步骤。
- 比如一个订单,我们可以用 select * from order_table where id = 'xxx' for update 进行加行锁,那么其他的事务就不能对其进行修改。
- 优点:理解起来简单,不需要维护额外的第三方中间件(比如 Redis,ZK)。
- 缺点:虽然容易理解但是实现起来较为繁琐,需要自己考虑锁超时,加事务等等。性能局限于数据库,一般对比缓存来说性能较低。对于高并发的场景并不是很适合。
基于Redis的实现分布式锁
利用setNx(set if not exist) 如果不存在则更新,可以很好的用来实现我们的分布式锁。
加锁代码
public class RedisTool {
private static final String LOCK_SUCCESS = "OK";
private static final String SET_IF_NOT_EXIST = "NX";
private static final String SET_WITH_EXPIRE_TIME = "PX";
/**
* 尝试获取分布式锁
* @param jedis Redis客户端
* @param lockKey 锁
* @param requestId 请求标识
* @param expireTime 超期时间
* @return 是否获取成功
*/
public static boolean tryGetDistributedLock(Jedis jedis, String lockKey, String requestId, int expireTime) {
String result = jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime);
if (LOCK_SUCCESS.equals(result)) {
return true;
}
return false;
}
}
可以看到,我们加锁就一行代码:jedis.set(String key, String value, String nxxx, String expx, int time)
,这个set()方法一共有五个形参:
- 第一个为key,我们使用key来当锁,因为key是唯一的。
- 第二个为value,我们传的是requestId,很多童鞋可能不明白,有key作为锁不就够了吗,为什么还要用到value?原因就是我们在上面讲到可靠性时,分布式锁要满足第四个条件解铃还须系铃人,通过给value赋值为requestId,我们就知道这把锁是哪个请求加的了,在解锁的时候就可以有依据。requestId可以使用
UUID.randomUUID().toString()
方法生成。 - 第三个为nxxx,这个参数我们填的是NX,意思是SET IF NOT EXIST,即当key不存在时,我们进行set操作;若key已经存在,则不做任何操作;
- 第四个为expx,这个参数我们传的是PX,意思是我们要给这个key加一个过期的设置,具体时间由第五个参数决定。
- 第五个为time,与第四个参数相呼应,代表key的过期时间。
- 总的来说,执行上面的set()方法就只会导致两种结果:1. 当前没有锁(key不存在),那么就进行加锁操作,并对锁设置个有效期,同时value表示加锁的客户端。2. 已有锁存在,不做任何操作。
我们的加锁代码满足我们可靠性里描述的三个条件。首先,set()加入了NX参数,可以保证如果已有key存在,则函数不会调用成功,也就是只有一个客户端能持有锁,满足互斥性。其次,由于我们对锁设置了过期时间,即使锁的持有者后续发生崩溃而没有解锁,锁也会因为到了过期时间而自动解锁(即key被删除),不会发生死锁。最后,因为我们将value赋值为requestId,代表加锁的客户端请求标识,那么在客户端在解锁的时候就可以进行校验是否是同一个客户端。
解锁代码
public class RedisTool {
private static final Long RELEASE_SUCCESS = 1L;
/**
* 释放分布式锁
* @param jedis Redis客户端
* @param lockKey 锁
* @param requestId 请求标识
* @return 是否释放成功
*/
public static boolean releaseDistributedLock(Jedis jedis, String lockKey, String requestId) {
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
Object result = jedis.eval(script, Collections.singletonList(lockKey), Collections.singletonList(requestId));
if (RELEASE_SUCCESS.equals(result)) {
return true;
}
return false;
}
}
可以看到,我们解锁只需要两行代码就搞定了!第一行代码,我们写了一个简单的Lua脚本代码。第二行代码,我们将Lua代码传到jedis.eval()
方法里,并使参数KEYS[1]赋值为lockKey,ARGV[1]赋值为requestId。eval()方法是将Lua代码交给Redis服务端执行。
那么这段Lua代码的功能是什么呢?其实很简单,首先获取锁对应的value值,检查是否与requestId相等,如果相等则删除锁(解锁)。那么为什么要使用Lua语言来实现呢?因为要确保上述操作是原子性的。那么为什么执行eval()方法可以确保原子性,源于Redis的特性,下面是官网对eval命令的部分解释:
简单来说,就是在eval命令执行Lua代码的时候,Lua代码将被当成一个命令去执行,并且直到eval命令执行完成,Redis才会执行其他命令。
可能存在的问题:
- 锁未被释放。
- 业务未执行完,锁过期。
- 主备切换,数据丢失:主节点加锁成功,锁还未同步到备节点,主节点挂了,备节点升级为主,锁丢失。
解决办法:
- 设置过期时间。
- 利用redisson实现,内部设置了watchdog,可以对锁进行续期。
- 可以利用Redlock实现,对多节点加锁。
基于Zookeeper实现分布式锁
使用zookeeper创建临时序列节点来实现分布式锁,适用于顺序执行的程序,大体思路就是创建临时序列节点,找出最小的序列节点,获取分布式锁,程序执行完成之后此序列节点消失,通过watch来监控节点的变化,从剩下的节点的找到最小的序列节点,获取分布式锁,执行相应处理,依次类推。
引入依赖
<dependency>
<groupId>com.101tec</groupId>
<artifactId>zkclient</artifactId>
<version>0.10</version>
</dependency>
创建锁的接口
package com.toov5.Lock;
public interface ExtLock {
//ExtLock基于zk实现分布式锁
public void getLock();
//释放锁
public void unLock();
}
模板方法模式
package com.toov5.Lock;
import org.I0Itec.zkclient.ZkClient;
//将重复代码抽象到子类中(模板方法设计模式)
public abstract class ZookeeperAbstractLock implements ExtLock {
private static final String CONNECTION="192.168.91.5:2181";
protected ZkClient zkClient = new ZkClient(CONNECTION);
private String lockPath="/lockPath";
//获取锁
public void getLock() {
//1、连接zkClient 创建一个/lock的临时节点
// 2、 如果节点创建成果,直接执行业务逻辑,如果节点创建失败,进行等待
if (tryLock()) {
System.out.println("#####成功获取锁######");
}else {
//进行等待
waitLock();
}
//3、使用事件通知监听该节点是否被删除 ,如果是,重新进入获取锁的资源
}
//创建失败 进行等待
abstract void waitLock();
abstract boolean tryLock();
//释放锁
public void unLock() {
//执行完毕 直接连接
if (zkClient != null) {
zkClient.close();
System.out.println("######释放锁完毕######");
}
}
}
创建子类实现上面的 抽象方法
package com.toov5.Lock;
import java.util.concurrent.CountDownLatch;
import org.I0Itec.zkclient.IZkDataListener;
public class ZookeeperDistrbuteLock extends ZookeeperAbstractLock {
@Override
boolean tryLock() {
try {
zkClient.createEphemeral(lockPath);
// System.out.println("#########获取锁######");
return true;
} catch (Exception e) {
// 如果失败 直接catch
return false;
}
}
@Override
void waitLock() {
IZkDataListener iZkDataListener = new IZkDataListener() {
// 节点被删除
public void handleDataDeleted(String arg0) throws Exception {
if (countDownLatch != null) {
countDownLatch.countDown(); // 计数器为0的情况,await 后面的继续执行
}
}
// 节点被修改
public void handleDataChange(String arg0, Object arg1) throws Exception {
}
};
// 监听事件通知
zkClient.subscribeDataChanges(lockPath, iZkDataListener);
// 控制程序的等待
if (zkClient.exists(lockPath)) { //如果 检查出 已经被创建了 就new 然后进行等待
countDownLatch = new CountDownLatch(1);
try {
countDownLatch.wait(); //等待时候 就不往下走了 当为0 时候 后面的继续执行
} catch (Exception e) {
// TODO: handle exception
}
}
//后面代码继续执行
//为了不影响程序的执行 建议删除该事件监听 监听完了就删除掉
zkClient.unsubscribeDataChanges(lockPath, iZkDataListener);
}
}
可能存在的问题:
- zk提交类似于一个2PC过程,设置锁的性能会低于redis
- Leader一旦挂掉,设置锁就不可用(相对而言redis多个master节点都可以写)
- 状态处理不正确,容易出现多个客户端持有锁或者释放不掉
参考:
https://redisbook.readthedocs.io/en/latest/feature/scripting.html
https://blog.csdn.net/xlgen157387/article/details/79036337
https://www.cnblogs.com/austinspark-jessylu/p/8043726.html
https://www.cnblogs.com/linjiqin/p/8003838.html