一、什么是事务?
事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
- 默认MysQL的事务是自动提交的,也就是说,当执行一条DML语句,MySQL会立即隐式的提交事务。
二、操作事务
- 查看/设置事务提交方式
SELECT @@autocommit;
SET @@autocommit=0;
0为手动提交,1为自动提交
- 开启事务
START TRANSACTION 或 BEGIN ;
- 提交事务
COMMIT;
- 回滚事务
ROLLBACK;
三、四大特性(ACID)
- 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
一个事务内的操作统一成功或失败
- 一致性(Consistency) :事务完成时,必须使所有的数据都保持一致状态。
事务前后的数据总量不变
- 隔离性(lsolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
事务与事务之间相互不影响
- 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
事务一旦提交发生的改变不可逆
四、事务原理
-
原子性:由undolog日志保证,他记录了需要回滚的日志信息,回滚时撤销已执行的sql
-
一致性:由其他三大特性共同保证,是事务的目的
-
隔离性:由MVCC保证
-
持久性:由redolog日志和内存保证,mysql修改数据时内存和redolog会记录操作,宕机时可恢复
-
redo log
重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的持久性。
该日志文件由两部分组成︰重做日志缓冲(redo log buffer)以及重做日志文件(redo log file) ,前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用。
-
undo log
回滚日志,用于记录数据被修改前的信息,作用包含两个:提供回滚和MVCC(多版本并发控制)。undo log和redo log记录物理日志不一样,它是逻辑日志。可以认为当delete一条记录时undo log中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rollback时,就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。 -
Undo log销毁: undo log在事务执行时产生,事务提交时,并不会立即删除undo log,因为这些日志可能还用于MVCC。
-
Undo log存储: undo log采用段的方式进行管理和记录,存放在前面介绍的 rollback segment 回滚段中,内部包含1024个undo logsegment。
五、并发事务问题
-
脏读
事务A、B处理同一条数据S,在事务A修改了S这条数据但是还未提交数据时,事务B读取了事务A修改后的数据S,然后事务A回滚了,导致事务B读取的该条数据S是不存在的,因为S是之前的内容。
REPEATABLE READ隔离机制就能解决 -
不可重复读
事务A、B处理同一条数据S,事务A读取了数据S,然后事务B修改了数据S,然后事务A又读取了数据S,此时事务A读取的两次S的数据是事务B修改前后的数据,显然不同。
REPEATABLE READ隔离机制就能解决 -
幻读
事务A、B处理一批数据Sn, 比如A先读了Sn的一个分类是10个数据,然后事务B给这个分类新增了一条数据,然后事务A再读这类数据发现变成11个了,这就是幻读。先后两次读取数个个数发生了变化,不同于不可重复读。
六、事务的隔离级别
在高并发情况下,并发事务会产生脏读、不可重复读、幻读问题,这时需要用隔离级别来控制。
-
读未提交:允许一个事务读取另一个事务已提交的数据,可能出现不可重复读,幻读。
-
读提交:只允许事务读取另一个事务没有提交的数据,可能出现不可重复读,幻读。
-
可重复读:确保同一字段多次读取结果一致,可能出现欢幻读。
-
可串行化: 所有事务逐次执行,没有并发问题。
Inno DB 默认隔离级别为可重复读级别,分为快照度和当前读,并且通过间隙锁解决了幻读问题。
- 查看事务隔离级别语句
SELECT @@TRANSACTION_ISOLATION;
- 设置事务隔离级别语句
SET [SESSION|(GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMiTTED │ REPEATABLE READ |SERIALIZABLE}
七、快照读和当前读
-
快照读:读取的是当前数据的可见版本,可能是会过期数据,简单的select (不加锁)就是快照读,不加锁,是非阻塞读。
- Read Committed:每次select,都生成一个快照读。
- Repeatable Read:开启事务后第一个select语句才是快照读的地方。
- Serializable:快照读会退化为当前读。
-
当前读:读取的是数据的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:
select ..lock in share mode(共享锁)
,select .. for update
、update
、insert
、delete(排他锁)
都是一种当前读。
八、MVCC
MVCC是多版本并发控制,为每次事务生成一个新版本数据,每个事务都由自己的版本,从而不加锁就决绝读写冲突,这种读叫做快照读。只在读已提交和可重复读中生效。
实现原理由四个东西保证:
1. undo log日志:
记录了数据历史版本,在insert、update、delete的时候产生的便于数据回滚的日志。
- 当insert的时候,产生的undo log日志只在回滚时需要,在事务提交后,可被立即删除。
- update、delete的时候,产生的undo log日志不仅在回滚时需要,在快照读时也需要,不会立即被删除。
2. readView:
事务进行快照读时动态生成产生的视图,记录了当前系统中活跃的事务id,控制哪个历史版本对当前事务可见。
ReadView中包含了四个核心字段:
版本链数据访问规则:
不同的隔离级别,生成ReadView的时机不同:
- READ COMMITTED:在事务中每一次执行快照读时生成ReadView。
- REPEATABLE READ:仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。