一 数据库为什么需要时钟
- 事务排序
- 事务顺序的标识决定事务的原子性和隔离性
- 时钟:日志LSN、事务ID、时间戳
- 支持MVCC
- 通过支持数据的多版本,允许读写相同数据并发
- 数据的多版本需要对数据进行时钟标识
二 分布式数据库中的事务排序问题
- 单机数据库
- 计算机的系统时钟是一个频率精确和稳定的脉冲信号发生器
- 物理时钟可以准确描述事件在当前机器发生的先后关系
- 分布式数据库
- 数据库实例运行在不同的物理位置,每个节点有独立的时钟
- 即使采用NTP同步,也可能发生毫秒级偏移
- 物理时钟不能作为分布式系统内并发事务排序的依据
三 分布式数据库中的事务排序方案
逻辑时钟(LC)
- Lamport,1987年,论文《Time, Clocks, and the Ordering of Events in a Distributed System》
- 事件先后(因果)关系 (a→b代表a发生在b之前,a||b代表a和b无关)
- a和b是同一进程内的事件,a发生在b之前,则a→b
- a和b在不同进程,a是发送进程内的发送事件,b是同一消息接收事件,则a→b
- 如果a→b且b→c,则a→c
- 算法描述
- 进程Pi每发生一次事件,Ci加1(Ci代表进程Pi的逻辑时钟)
- 进程Pi给进程Pj发送消息,需要带上自己的本地逻辑时钟Ci
- 进程Pj接收消息,更新Cj为 max (Ci, Cj) + 1