事务概念
什么是事务:事务就是一组原子性的SQL查询,事务包括的所有SQL语句(START TRANSACTION和COMMIT/ROLLBACK之间的语句)要么全部执行成功(COMMIT),要么全部执行失败(或者说全都不执行,ROLLBACK)。一个运行良好的事务处理系统,必须具备这些ACID特征:
A原子性(atomicity):一个事务必须被视为一个不可分割的最小工作单元, 整个事务中的所有操作要么全部提交成功, 要么全部失败回滚, 对于一个事务来说, 不可能只执行其中的一部分操作, 这就是事务的原子性。
C一致性(consistency):数据库总是从一个一致性的状态转换到另外一个一致性的状态。比如银行系统中,转账过程中即使系统崩溃,各个账户的金额也是正确的,因为事务最终没有提交, 所以事务中所做的修改也不会保存到数据库中。
I隔离性(isolation):通常来说, 一个事务所做的修改在最终提交以前, 对其他事务是不可见的。
D持久性(durability):一旦事务提交, 则其所做的修改就会永久保存到数据库中。此时即使系统崩溃, 修改的数据也不会丢失。
隔离级别
ACID中的隔离性其实比想象的要复杂。 在SQL标准中定义了四种隔离级别,每一种级别都规定了一个事务中所做的修改, 哪些在事务内和事务间是可见的, 哪些是不可见的。 较低级别的隔离通常可以执行更高的并发,系统的开销也更低。
未提交读
事务中的修改, 即使没有提交,对其他事务也都是可见的。 事务可以读取未提交的数据,这也被称为脏读 。
已提交读
一个事务从开始直到提交之前,所做的任何修改对其他事务都是不可见的,提交过后对其他事务可见。这个级别有时候也叫做不可重复读,因为两次执行同样的查询, 可能会得到不一样的结果(不可重复读,某个事物读取了某行记录后,另外一个事务改行记录执行了更改,之前的事务再去读取该行记录时,两次读取的结果不一致)。
可重复读
该级别保证了在同一个事务中多次读取同样记录的结果是一致的。理论上, 可重复读隔离级别还是无法解决另外一个幻读的问题(指的是当某个事务在读取某个范围内的记录时,另外一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,会产生幻行) InnoDB存储引擎通过多版本并发控制(MVCC, Multiversion Concurrency Control) 解决了幻读的问题。可重复读是MySQL的默认事务隔离级别。
可串行化
SERIALIZABLE 是最高的隔离级别。 它通过强制事务串行执行,避免了前面说的幻读的问题。 简单来说,会在读取的每一行数据上都加, 所以可能导致大量的超时和锁争用的问题。 实际应用中也很少用到这个隔离级别, 只有在非常需要确保数据的一致性而且可以接受没有并发的情况下, 才考虑采用该级别。
隔离级别与读取情况
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
未提交读 | 会 | 会 | 会 |
提交读 | 不会 | 会 | 会 |
可重复读 | 不会 | 不会 | 会 |
可串行化 | 不会 | 不会 | 不会 |
多版本并发控制MVCC
MVCC概念:MVCC的实现, 是通过保存数据在某个时间点的快照来实现的。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。 根据事务开始的时间不同,每个事务对同一张表,同一时刻看到的数据可能是不一样的。
MySQL的InnoDB引擎中实现的MVCC
InnoDB的MVCC, 是通过在每行记录后面保存两个隐藏的列来实现的。 这两个列,一个保存了行的创建时间, 一个保存行的过期时间(或删除时间) 。 当然存储的并不是实际的时间值, 而是系统版本号。每开始一个新的事务,系统版本号都会自动递增。 事务开始时刻的系统版本号会作为事务的版本号, 用来和查询到的每行记录的版本号进行比较。 下面看一下在可重复读 隔离级别下, MVCC具体是如何操作的。
SELECT
InnoDB会根据以下两个条件检查每行记录:
a. InnoDB只查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
b. 行的删除版本要么未定义, 要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
只有符合上述两个条件的记录, 才能返回作为查询结果。
INSERT
InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
DELETE
InnoDB为删除的每一行保存当前系统版本号作为行删除标识。
UPDATE
InnoDB为插入一行新记录, 保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。
InnoDB实现的MVCC总结
保存这两个额外系统版本号, 使大多数读操作都可以不用加锁。 这样设计使得读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行。 不足之处是每行记录都需要额外的存储空间, 需要做更多的行检查工作, 以及一些额外的维护工作。MVCC只在可重复读 和提交读 两个隔离级别下工作。 其他两个隔离级别都和MVCC不兼容,因为未提交读总是读取最新的数据行,而不是符合当前事务版本的数据行。而可串行化则会对所有读取的行都加锁。
《高性能MySQL》: 第3版/( 美) 施瓦茨( Schwartz,B.) ,( 美)扎伊采夫( Zaitsev,P.),( 美)特卡琴科(Tkachenko,V.) 著; 宁海元等译.—北京:电子工业出版社,2013.5