受益匪浅！图解Janusgraph系列-并发安全：锁机制（本地锁+分布式锁）超全分析(1)

最新推荐文章于 2024-08-25 22:02:44 发布

2401_84247423

最新推荐文章于 2024-08-25 22:02:44 发布

阅读量1k

点赞数 10

分类专栏：程序员文章标签：分布式

本文链接：https://blog.csdn.net/2401_84247423/article/details/138298563

版权

程序员专栏收录该内容

211 篇文章 2 订阅

订阅专栏

throw new PermanentLockingException(“Attempted to obtain a lock after mutations had been persisted”);
// 使用key+column组装为lockID，供下述加锁使用！！！！！
KeyColumn lockID = new KeyColumn(key, column);
log.debug(“Attempting to acquireLock on {} ev={}”, lockID, expectedValue);
// 获取本地当前jvm进程中的写锁（看下述的 1：写锁获取分析）
// （此处的获取锁只是将对应的KLV存储到Hbase中！存储成功并不代表获取锁成功）
// 1. 获取成功（等同于存储成功）则继续执行
// 2. 获取失败（等同于存储失败），会抛出异常，抛出到最上层，打印错误日志“Could not commit transaction [“+transactionId+”] due to exception” 并抛出对应的异常，本次插入数据结束
locker.writeLock(lockID, tx.getConsistentTx());
// 执行前提：上述获取锁成功！
// 存储期望值，此处为了实现当相同的key + value + tx多个加锁时，只处理第一个
// 存储在事务对象中，标识在commit判断锁是否获取成功时，当前事务插入的是哪个锁信息
tx.storeExpectedValue(this, lockID, expectedValue);
} else {
// locker为空情况下，直接抛出一个运行时异常，终止程序
store.acquireLock(key, column, expectedValue, unwrapTx(txh));
}
}

2、执行 locker.writeLock(lockID, tx.getConsistentTx()) 触发锁获取

public void writeLock(KeyColumn lockID, StoreTransaction tx) throws TemporaryLockingException, PermanentLockingException {

if (null != tx.getConfiguration().getGroupName()) {
MetricManager.INSTANCE.getCounter(tx.getConfiguration().getGroupName(), M_LOCKS, M_WRITE, M_CALLS).inc();
}

// 判断当前事务是否在图实例的维度已经占据了lockID的锁
// 此处的lockState在一个事务成功获取本地锁+分布式锁后，以事务为key、value为map，其中key为lockID，value为加锁状态（开始时间、过期时间等）
if (lockState.has(tx, lockID)) {
log.debug(“Transaction {} already wrote lock on {}”, tx, lockID);
return;
}

// 当前事务没有占据lockID对应的锁
// 进行(lockLocally(lockID, tx）本地加锁锁定操作，
if (lockLocally(lockID, tx)) {
boolean ok = false;
try {
// 在本地锁获取成功的前提下：
// 尝试获取基于Hbase实现的分布式锁；
// 注意！！！（此处的获取锁只是将对应的KLV存储到Hbase中！存储成功并不代表获取锁成功）
S stat = writeSingleLock(lockID, tx);
// 获取锁分布式锁成功后（即写入成功后），更新本地锁的过期时间为分布式锁的过期时间
lockLocally(lockID, stat.getExpirationTimestamp(), tx); // update local lock expiration time
// 将上述获取的锁，存储在标识当前存在锁的集合中Map<tx,Map<lockID,S>>， key为事务、value中的map为当前事务获取的锁，key为lockID，value为当前获取分布式锁的ConsistentKeyStatus（一致性密匙状态）对象
lockState.take(tx, lockID, stat);
ok = true;
} catch (TemporaryBackendException tse) {
// 在获取分布式锁失败后，捕获该异常，并抛出该异常
throw new TemporaryLockingException(tse);
} catch (AssertionError ae) {
// Concession to ease testing with mocks & behavior verification
ok = true;
throw ae;
} catch (Throwable t) {
// 出现底层存储错误！则直接加锁失败！
throw new PermanentLockingException(t);
} finally {
// 判断是否成功获取锁，没有获分布式锁的，则释放本地锁
if (!ok) {
// 没有成功获取锁，则释放本地锁
// lockState.release(tx, lockID); // has no effect
unlockLocally(lockID, tx);
if (null != tx.getConfiguration().getGroupName()) {
MetricManager.INSTANCE.getCounter(tx.getConfiguration().getGroupName(), M_LOCKS, M_WRITE, M_EXCEPTIONS).inc();
}
}
}
} else {
// 如果获取本地锁失败，则直接抛出异常，不进行重新本地争用

// Fail immediately with no retries on local contention
throw new PermanentLockingException(“Local lock contention”);
}
}

包含两个部分：

本地锁的获取lockLocally(lockID, tx)
分布式锁的获取writeSingleLock(lockID, tx) 注意此处只是将锁信息写入到Hbase中，并不代表获取分布式锁成功，只是做了上述介绍的第一个阶段分布式锁信息插入

3、本地锁获取 lockLocally(lockID, tx)

public boolean lock(KeyColumn kc, T requester, Instant expires) {
assert null != kc;
assert null != requester;

final StackTraceElement[] acquiredAt = log.isTraceEnabled() ?
new Throwable("Lock acquisition by " + requester).getStackTrace() : null;

// map的value，以事务为核心
final AuditRecord audit = new AuditRecord<>(requester, expires, acquiredAt);
// ConcurrentHashMap实现locks, 以lockID为key，事务为核心value
final AuditRecord inMap = locks.putIfAbsent(kc, audit);

boolean success = false;

// 代表当前map中不存在lockID，标识着锁没有被占用，成功获取锁
if (null == inMap) {
// Uncontended lock succeeded
if (log.isTraceEnabled()) {
log.trace(“New local lock created: {} namespace={} txn={}”,
kc, name, requester);
}
success = true;
} else if (inMap.equals(audit)) {
// 代表当前存在lockID，比对旧value和新value中的事务对象是否是同一个
// requester has already locked kc; update expiresAt
// 上述判断后，事务对象为同一个，标识当前事务已经获取这个lockID的锁；
// 1. 这一步进行cas替换，作用是为了刷新过期时间
// 2. 并发处理，如果因为锁过期被其他事务占据，则占用锁失败
success = locks.replace(kc, inMap, audit);
if (log.isTraceEnabled()) {
if (success) {
log.trace(“Updated local lock expiration: {} namespace={} txn={} oldexp={} newexp={}”,
kc, name, requester, inMap.expires, audit.expires);
} else {
log.trace(“Failed to update local lock expiration: {} namespace={} txn={} oldexp={} newexp={}”,
kc, name, requester, inMap.expires, audit.expires);
}
}
} else if (0 > inMap.expires.compareTo(times.getTime())) {
// 比较过期时间，如果锁已经过期，则当前事务可以占用该锁

// the recorded lock has expired; replace it
// 1. 当前事务占用锁
// 2. 并发处理，如果因为锁过期被其他事务占据，则占用锁失败
success = locks.replace(kc, inMap, audit);
if (log.isTraceEnabled()) {
log.trace(“Discarding expired lock: {} namespace={} txn={} expired={}”,
kc, name, inMap.holder, inMap.expires);
}
} else {
// 标识：锁被其他事务占用，并且未过期，则占用锁失败
// we lost to a valid lock
if (log.isTraceEnabled()) {
log.trace(“Local lock failed: {} namespace={} txn={} (already owned by {})”,
kc, name, requester, inMap);
log.trace(“Owner stacktrace:\n {}”, Joiner.on("\n ").join(inMap.acquiredAt));
}
}

return success;
}

如上述介绍，本地锁的实现是通过ConcurrentHashMap数据结构来实现的，在图实例维度下唯一！

4、分布式锁获取第一个阶段：分布式锁信息插入

protected ConsistentKeyLockStatus writeSingleLock(KeyColumn lockID, StoreTransaction txh) throws Throwable {

// 组装插入hbase数据的Rowkey
final StaticBuffer lockKey = serializer.toLockKey(lockID.getKey(), lockID.getColumn());
StaticBuffer oldLockCol = null;

// 进行尝试插入，默认尝试次数3次
for (int i = 0; i < lockRetryCount; i++) {
// 尝试将数据插入到hbase中；oldLockCol表示要删除的column代表上一次尝试插入的数据
WriteResult wr = tryWriteLockOnce(lockKey, oldLockCol, txh);
// 如果插入成功
if (wr.isSuccessful() && wr.getDuration().compareTo(lockWait) <= 0) {
final Instant writeInstant = wr.getWriteTimestamp(); // 写入时间
final Instant expireInstant = writeInstant.plus(lockExpire);// 过期时间
return new ConsistentKeyLockStatus(writeInstant, expireInstant); // 返回插入对象
}
// 赋值当前的尝试插入的数据，要在下一次尝试时删除
oldLockCol = wr.getLockCol();
// 判断插入失败原因，临时异常进行尝试，非临时异常停止尝试！
handleMutationFailure(lockID, lockKey, wr, txh);
}
// 处理在尝试了3次之后还是没插入成功的情况，删除最后一次尝试插入的数据
tryDeleteLockOnce(lockKey, oldLockCol, txh);
// TODO log exception or successful too-slow write here
// 抛出异常，标识导入数据失败
throw new TemporaryBackendException(“Lock write retry count exceeded”);
}

上述只是将锁信息插入，插入成功标识该流程结束

5、分布式锁获取第一个阶段：分布式锁锁定是否成功判定

这一步，是在commit阶段进行的验证

public void commit() throws BackendException {
// 此方法内调用checkSingleLock 检查分布式锁的获取结果
flushInternal();
tx.commit();
}

最终会调用checkSingleLock方法，判断获取锁的状态！

protected void checkSingleLock(final KeyColumn kc, final ConsistentKeyLockStatus ls,
final StoreTransaction tx) throws BackendException, InterruptedException {

// 检查是否被检查过
if (ls.isChecked())
return;

// Slice the store
KeySliceQuery ksq = new KeySliceQuery(serializer.toLockKey(kc.getKey(), kc.getColumn()), LOCK_COL_START,
LOCK_COL_END);
// 此处从hbase中查询出锁定的行的所有列！默认查询重试次数3
List claimEntries = getSliceWithRetries(ksq, tx);

// 从每个返回条目的列中提取timestamp和rid，然后过滤出带有过期时间戳的timestamp对象
final Iterable iterable = Iterables.transform(claimEntries,
e -> serializer.fromLockColumn(e.getColumnAs(StaticBuffer.STATIC_FACTORY), times));
final List unexpiredTRs = new ArrayList<>(Iterables.size(iterable));
for (TimestampRid tr : iterable) { // 过滤获取未过期的锁！
final Instant cutoffTime = now.minus(lockExpire);
if (tr.getTimestamp().isBefore(cutoffTime)) {
…
}
// 将还未过期的锁记录存储到一个集合中
unexpiredTRs.add(tr);
}
// 判断当前tx是否成功持有锁！如果我们插入的列是读取的第一个列，或者前面的列只包含我们自己的rid（因为我们是在第一部分的前提下获取的锁，第一部分我们成功获取了基于当前进程的锁，所以如果rid相同，代表着我们也成功获取到了当前的分布式锁），那么我们持有锁。否则，另一个进程持有该锁，我们无法获得锁
// 如果，获取锁失败，抛出TemporaryLockingException异常！！！！抛出到顶层的mutator.commitStorage()处，最终导入失败进行事务回滚等操作
checkSeniority(kc, ls, unexpiredTRs);
// 如果上述步骤未抛出异常，则标识当前的tx已经成功获取锁！
ls.setChecked();
}

四：整体流程

总流程如下图：

整体流程为：

获取本地锁
获取分布式锁
插入分布式锁信息
commit阶段判断分布式锁获取是否成功
获取失败，则重试

五：总结

JanusGraph的锁机制主要是通过本地锁+分布式锁来实现分布式系统下的数据一致性；

分布式锁的控制维度为：property、vertex、edge、index都可以；

JanusGraph支持在数据导入时通过前面一致性行为部分所说的LOCK来开关分布式锁：

LOCK：数据导入时开启分布式锁保证分布式一致性
DEFAULT、FORK：数据导入时关闭分布式锁

是否开启分布式锁思考：

在开启分布式锁的情况下，数据导入开销非常大；如果是数据不是要求很高的一致性，并且数据量比较大，我们可以选择关闭分布式锁相关，来提高导入速度；

然后，针对于小数据量的要求高一致性的数据，单独开启分布式锁来保证数据安全；

另外，我们在不开启分布式锁定的情况下，可以通过针对于导入的数据的充分探查来减少冲突！

针对于图schema的元素开启还是关闭分布式锁，还是根据实际业务情况来决定。

最后

大家看完有什么不懂的可以在下方留言讨论.
谢谢你的观看。
觉得文章对你有帮助的话记得关注我点个赞支持一下！

作者：洋仔聊编程
链接：https://juejin.cn/post/6907081858548006920

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以点击这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

链接：https://juejin.cn/post/6907081858548006920

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以点击这里获取

2401_84247423

关注

10
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
受益匪浅！图解Janusgraph系列-并发安全：锁机制（本地锁+分布式锁）超全分析(1)

JanusGraph的锁机制主要是通过本地锁+分布式锁来实现分布式系统下的数据一致性；分布式锁的控制维度为：property、vertex、edge、index都可以；JanusGraph支持在数据导入时通过前面一致性行为部分所说的LOCKLOCK：数据导入时开启分布式锁保证分布式一致性DEFAULT、FORK：数据导入时关闭分布式锁在开启分布式锁的情况下，数据导入开销非常大；如果是数据不是要求很高的一致性，并且数据量比较大，我们可以选择关闭分布式锁相关，来提高导入速度；
复制链接

扫一扫