多版本并发控制(MVCC=Multi-Version Concurrency Control),是一种用来解决读 - 写冲突的无
锁并发控制。也就是为事务分配单向增长的时间戳,为每个修改保存一个版本。版本与事务时间戳
关联,读操作只读该事务开始前的数据库的快照(复制了一份数据)。这样在读操作不用阻塞写操
作,写操作不用阻塞读操作的同时,避免了脏读和不可重复读。
以下是对这段话的解释
无锁并发控制
MVCC 是一种无锁并发控制技术,意味着在进行读写操作时,不需要通过加锁来管理并发事务。这有助于提高数据库的并发性能,减少锁争用的问题。
时间戳和版本
- 单向增长的时间戳: 每个事务在开始时被分配一个唯一的、单调递增的时间戳。这个时间戳标识了事务的开始时间,并用于版本控制。
- 版本管理: 每次对数据进行修改时,会创建一个新的版本。每个版本都与进行该修改的事务的时间戳关联起来。
快照读(Snapshot Read)
- 读操作读取快照: 在读操作开始时,事务会读取数据库的快照。这个快照是该事务开始时的数据状态,而不是实际数据的最新状态。
快照(Snapshot)是一种捕获某一特定时刻的数据状态的方法。
- 避免读写冲突: 由于读操作只读取事务开始前的快照数据,即使有其他事务正在进行写操作,也不会阻塞当前的读操作。同样,读操作也不会阻塞其他事务的写操作。
避免脏读和不可重复读
- 脏读: 脏读发生在一个事务读取了另一个事务未提交的数据。MVCC 通过读取事务开始前的快照,确保读操作只读取已提交的数据,从而避免了脏读。
- 不可重复读: 不可重复读发生在一个事务在两次读取之间,另一个事务对数据进行了修改并提交。MVCC通过让事务始终读取其开始时的快照,确保在同一事务内的多次读取结果一致,从而避免了不可重复读。
举例说明
假设有一个数据库表 employees,包含以下数据:
id name salary
1 Alice 5000
2 Bob 6000
3 Carol 7000
事务 A 和事务 B 的操作
事务 A 在时间戳 T1 开始,并读取所有员工的工资总和:
START TRANSACTION;
SELECT SUM(salary) FROM employees;
事务 B 在时间戳 T2(T2 > T1)开始,并更新 Bob 的工资,然后提交:
START TRANSACTION;
UPDATE employees SET salary = 6500 WHERE name = 'Bob';
COMMIT;
事务 A 在时间戳 T3 继续读取数据:
SELECT SUM(salary) FROM employees;
在时间戳 T1,事务 A 读取的工资总和是 18000(5000 + 6000 + 7000)。即使事务 B 在时间戳 T2 更新了 Bob 的工资,并在时间戳 T3 提交了更改,事务 A 继续读取时仍然看到的是事务开始时的快照数据(即时间戳 T1 的数据)。因此,事务 A 看到的工资总和仍然是 18000,而不是 18500。
总结
MVCC 通过为每个事务分配唯一的时间戳,并为每次数据修改创建新版本,确保了读操作与写操作之间的无锁并发。事务在读取数据时,只读取事务开始前的数据快照,从而避免了脏读和不可重复读。这种机制大大提高了数据库的并发性能和数据一致性。