MySQL 的 InnoDB 存储引擎使用多版本并发控制(MVCC)来支持高并发和事务的隔离性。MVCC 允许事务在读取数据时看到事务开始时的一致性快照,而不是其他并发事务可能正在修改的数据版本。
MVCC 主要涉及以下几个概念:
- undo 日志(Undo Log):用于保存旧版本的数据,以便在需要时可以回滚事务或构建事务开始时的数据快照。当一个事务修改数据时,它不会直接覆盖原始数据,而是创建一个新的数据版本并将其保存在 undo 日志中。
- read view:每个事务都有一个唯一的 read view,它决定了事务可以看到哪些版本的行。read view 是在事务开始时创建的,并基于当时活跃的事务列表。
以下是 MVCC 和 undo 日志以及 read view 的工作流程:
1. 事务开始
- 当一个事务开始时,它会创建一个唯一的 read view。
- 这个 read view 会记录当前所有活跃事务的 ID。
2. 数据读取
- 当事务需要读取数据时,它会使用其 read view 来确定哪些版本的行是可见的。
- 对于每一行,事务会检查其创建时间和删除时间(如果有的话)。
- 如果行的创建时间晚于事务的开始时间,并且其删除时间要么不存在,要么晚于事务的开始时间,那么这一行对当前事务是可见的。
- 如果行在事务开始后被删除,但由于其删除时间晚于事务的开始时间,它仍然会出现在查询结果中,但会被标记为已删除。
3. 数据修改
- 当事务修改数据时,它不会直接覆盖原始数据。
- 相反,它会创建一个新的数据版本,并将其保存在 undo 日志中。
- 同时,原始数据版本会被标记为已删除,但不会被立即删除,因为其他事务可能仍然需要它。
4. 事务提交或回滚
- 如果事务提交,其所有的修改(即新的数据版本)将变为永久,并且旧的数据版本(在 undo 日志中)可能会在稍后被清理。
- 如果事务回滚,其所有的修改都会被撤销,并且原始数据版本将恢复为可见状态。
5. 并发控制
- 由于每个事务都有自己的 read view 和可见的数据版本,因此多个事务可以并发执行,而不会互相干扰。
- 通过这种方式,MVCC 提供了强大的并发性和事务隔离性。
总结
MVCC 通过结合 undo 日志和 read view 提供了非阻塞的读取操作和强大的并发控制。这使得 InnoDB 存储引擎能够在高并发环境下保持高性能和数据的一致性。