0.写在前面
based on CMU 15-445/645 2020fall, Lecture #18 ~ Lecture #19.
1: 并发控制 - Timestamp Ordering (T/O)
(上)中主要介绍2PL,在下中我们介绍并发控制的另一种方法Timestamp Ordering (T/O)。
1.1 关于timestamp选择
1.system clock:如果使用clock,那么在分布式系统中时间同步可能出现问题。(夏令时回调时间)
2.logic counter:(32位或者64位)一旦溢出存储大小,会出问题。
3.hybird:一般采用1和2的混合。前几位是系统时间,后几位是逻辑时间。
1.2 Timestamp Ordering (T/O) 定义
简单来说就是read和write不需要锁。每一个Object都有2个Timestamp(read and write)定义为W-TS(X)、R-TS(X)。
Read的规则:
Write的规则:
例子:init:TS(T1)=1, TS(T2)=2.
首先更新R-TS(T1)=1,W-TS(T1)=2. 当遇到T1进行W(A)的时候,出现TS(T1) < W-TS(A),即重复写的操作。
Tomas write rule:
根据Tomas write rule,上述的例子就可以忽视T1中W(A)的操作,因为在shedule中T1比T2先执行,所以T1中的W(A)会被T2中的W(A)覆盖掉。
1.3 BASIC T/O PERFORMANCE ISSUES(问题)
1.复制数据库数据到私人领域的开销很大。
2. starved(饥饿)。
2: OPTIMISTIC CONCURRENCY CONTROL(OCC)
2.1 定义阶段
2.1.1 第一个是读写阶段,在私人领域读写;
2.2.2 第二个阶段是验证阶段,判断是否产生冲突;
验证阶段的核心:1)guarantee serializable schedules 。 2) check RW and WW conflicts
2.2.3 第三个阶段是写阶段,将私人领域的变化写到数据库中。
2.2 例子
3: MULTI-VERSION CONCURRENCY CONTROL(MVCC)
MVCC叫做多版本并发控制,实际上就是保存了数据在某个时间节点的snapshot(快照)。
有三个特点:
1)写不会阻塞读;读也不会阻塞写。
2)仅仅读的事物不会收到锁的限制。
3)对于time-travel 询问会非常快。
3.1例子(1)
T1会读版本A0,因为TS(T1)=1,在A1的begin,end的时间戳中。
3.2例子(2)
T2会读到A0的版本,这里也是因为事务的隔离级别导致的,如果是Serializable的话会等到T1commit之后才会生效。
3.2 MVCC 设计的决策
1)Concurrency Control Protocol(2PL,OCC,TO…)
2)Version Storage
3)Garbage Collection
4)Index Management
5)Deletes
3.2.1 Version Storage(version chain,链表)
方法三:将改变的属性复制到额外的空间中。只维护这些改变的属性。
version chain的方法:从新到旧,从旧到新。
3.2.2 Garbage Collection
例子:T1和T2都大于A100和B100中的end的时间戳,所以可以直接回收。具体实现可以使用bitmap的思想。