事务四大特性(ACID)
- 原子性(Atomicity):事务包含的所有操作要么全部成功,要么全部失败回滚。
- 一致性(Consistency):事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。
- 隔离性(Isolation):事务之间相互隔离不被干扰。
- 持久性(Durability):持久性是指一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便是在数据库系统遇到故障的情况下也不会丢失提交事务的操作。
隔离级别
脏读:A 事务读取了 B 事务没有提交的数据,然后 B 事务回滚了操作,导致 A 事务读取到的数据是错误的。
不可重复读:A 事务读取了资源,然后在执行别的操作,此时 B 事务修改或删除了这个资源,然后 A 事务再次读取该资源,前后两次读取到的数据不一致。
幻读:A 事务读取了某一范围的数据后,B 事务在该范围内又插入了数据,A 事务再去读取这一范围数据的数据发现不一致。
- Read uncommitted(未授权读取、读未提交),会出现幻读、脏读、不可重复读。
- Read committed(授权读取、读提交),会出现幻读和不可重复读。
- Repeatable read(可重复读取),会出现幻读,mysql 默认的。
- Serializable(序列化)。
MVCC 多版本控制器
MVCC 多版本控制器全称叫 Mutli Version Concurreny Control。所谓多版本其实是指每一行数据被多个事务操作后产生了多个版本。Read committed和Repeatable read两种隔离级别就是采用 MVCC 来实现的。
每一行数据都有两个或者三个隐藏字段。
- DB_TRX_ID:最近对这条数据进行过增删改的事务 ID,删除是一种特殊的更新。
- DB_ROLL_PTR:回滚指针。每一行数据经过增删改之后都会在 undo-log 产生一个快照,回滚指针就是指向上一个快照的地址。
- DB_ROW_ID:如果这行数据没有主键或者唯一索引,系统会自动为这行数据生成一个 DB_ROW_ID,这个 id 是自增的。
在进行增删改操作的时候,系统会生成一个 事务ID。在某个时间段内如果有多个事务同时在操作数据库,如生成了[100,101,102,103,104,105]
六个事务 id,每一个数据都对user
表中id=1
的数据进行了更新操作,其中101,103,104
提交了事务。
每次客户端连接服务器的时候,都会建立一个 session 连接,建立连接时会生成一个一致性视图 read-view。read-view 中包含了这次 session 连接之前所有未提交的事务数组 [100,102,105] 和最大事务 id MAX_DB_TRX_ID=105和最小事务 id MIN_DB_TRX_ID=100。这个 session 在查询数据的时候,会将 read-view 中的数据和数据行中的事务 id row_trx_id比较,如果:
- row_trx_id < MIN_DB_TRX_ID,该数据行中的事务 id 小于一致性视图中的最小事务id,表示这行数据在这个 session 连接时就已经提交过了,这行数据是可见的。
- row_trx_id > MAX_DB_TRX_ID,该数据行中的事务 id 大于一致性视图中的最大事务id,则表示这行数据是在这个 session 连接之后修改或者新增的数据,不可见。
- MIN_DB_TRX_ID < row_trx_id < MAX_DB_TRX_ID,该数据行中的事务 id 大于视图中的最小事务 id 且小于视图中的最大事务 id,则有两种情况要区分。
- 如果 row_trx_id 在一致性视图中未提交事务 id 数组中,则表示当 session 连接时,这行数据还没有被提交,数据不可见。
- 如果 row_trx_id 不在一致性视图的未提交事务 id 数组中,则表示当 session 连接时,这行数据已经被提交了,数据可见。
每当遇到数据不可见的情况,则根据当前行数据的 DB_ROLL_PTR 回滚指针去 undo-log 中找上一个版本的数据,做同样相同的对比操作,直到找到数据为止。
RC 和 RR 两个隔离级别的差别:在 RR 可重复读级别时,只有 session 连接时会生成一个 read-view 一致性视图快照,后面会一直沿用这个快照。而在 RC 读提交隔离级别的时候,每一次增删改查操作都会更新连接时的一致性视图快照,这样就造成了可以读取到其它事务提交的数据的现象。