文章目录
1. HBase 行级事务模型
HBase目前只支持行级事务
1.1. HBase事务原子性保证
HBase数据会首先写入WAL,再写入Memstore。写入Memstore异常很容易可以回滚,因此保证写入/更新原子性只需要保证写入WAL的原子性即可。
1.2. 写写并发控制
1.2.1. 如何实现写写并发控制?
实现写写并发其实很简单,只需要在写入(或更新)之前先获取行锁,如果获取不到,说明已经有其他线程拿了该锁,就需要不断重试等待或者自旋等待,直至其他线程释放该锁。拿到锁之后开始写入数据,写入完成之后释放行锁即可。
1.2.2. 如何实现批量写入多行的写写并发?
HBase支持批量写入(或批量更新),即一个线程同时更新同一个Region中的多行记录。
那如何保证当前事务中的批量写入与其他事务中的批量写入的并发控制呢?还是使用行锁,但是必须使用两阶段锁协议
- 获取所有待写入(更新)行记录的行锁;
- 开始执行写入(更新)操作;
- 写入完成之后再统一释放所有行记录的行锁。
不能更新一行锁定(释放)一行,多个事务之间容易形成死锁。两阶段锁协议就是为了避免死锁。
1.3. 读写并发控制
1.3.1. 如何实现读写并发控制?
实现读写并发最简单的方法就是仿照写写并发控制 – 加锁。但几乎所有数据库都不会这么做,性能太差,对于读多写少的应用来说必然不可接受。
使用MVCC(Multi Version Concurrent Control)
机制实现读写并发控制。Base中MVCC机制实现主要分为两步:
- 为每一个写(更新)事务分配一个Region级别自增的序列号;
- 为每一个读请求分配一个已完成的最大写事务序列号。
Region级别的自增序列Id,参见 Hbase 的 sequenceId
详情参见 Hbase 行级事务模型