事务:
事务是不可能分隔的逻辑工作单元,需要保证原子性、隔离性、一致性、持久性的一个或者多个数据库操作称为一个事务。
事务具备四个属性(ACID):
例:小明向小强转账10元。
原子性(Atomicity):
事物是一个完整的操作,各个操作不可分,要么都执行,要么都不执行。所以我们把要么全部做,要么全部不做的规则称之为原子性。
转账是一个不可分割操作,要么成功,要么失败,不可能存在中间状态(小明转出了,小强没有转入)。
隔离性(Isolation):
对数据修改的并非事务是彼此隔离的,不应该依赖任何方或者影响其他事务。
小明向小强转账10元。
小明向小红转账10元。
隔离性表示上面两个操作互不影响
一致性(Consistency):
数据库某些操作的原子性和隔离性是保证一致性的一种手段。
对于上面转账,一致性表示装置完成后,保证整个系统的余额等于所有账户的收入减支出。即小明的账户少了10元,小强的账户多10元。
持久性(Durability):
事务的日志能保证事务的永久性。
对于转账记录,需要永久保存。
事务的使用:
自动提交:
通过 show variables like 'autocommit'; 查看
默认情况下,因为事务的自动提交开启,每条sql语句相当于一个独立的事务,不需要显示的使用开启事务/结束事务。
关闭自动提交:
1、改变系统变量的值,set autocommit = off,当使用update等更新语句时需要手动提交。
2、显示的使用start transaction/begin开启一个事务。
隐式提交:
当通过begin/start transaction开启一个事务时,或关闭了自动提交,事务需要显示的提交,但是一下某些情况会隐式的提交事务,就像输入了commit一样,如:
- 定义或修改数据库对象的数据定义语言(Data definition language,DDL)。数据库对象即指数据库、表、视图、存储过程等,当我们使用create、drop、alter等语句修改数据库对象时,就会隐式提交前边的所有事务;
- 隐式使用或修改mysql数据库中的表,使用alter user、create user、drop user、set password等语句也会隐式提交前边语句的事务。
- 使用事务控制或关于锁定的语句:当前一个事务还没commit/rollback时,又是用begin/start transaction开启另一个事务,会隐式提交上一个事务;或当前autocommit为off,把它设置为on时,也会提交前边未提交的事务;或使用lock tables、unlock tables等关于锁定的语句也会提交前一个事务。
- 加载数据的语句,使用load data来批量往数据库中导入数据,也会隐式提交前一个事务。
- 其他一些语句:使用 analyze table、cache index、check table、flush、load index into cahce、optimize table、repair table、reset等语句也会隐式提交。
事务保存点:
当事务有很多语句时,可以设置多个保存节点,通过rollback来恢复到指定保存点,这样就不用完全回滚到事务的开始。rollback不跟保存点名称会回到事务最开始。
-- 设置保存点
savepoint 保存点名称;
-- 回到指定保存点
rollback [work] to [savepoint] 保存点名称;
-- 删除指定保存点
release savepoint 保存点名称;
开启事务:
begin [work];
// 或
start transaction;
提交事务:
commit;
终止/回滚事务:
rollback;
事务隔离性详解:
查看隔离级别:
msql默认为可重复读隔离级别。select @@tx_isolation;
修改隔离级别:
修改session范围内的隔离级别:
set session transaction isolation level read uncommitted;
读未提交(read uncommitted):
一个事务可以读到其他事务还没提交的数据修改,会出现脏读(读到另一个未提交事务修改的数据)。
读已提交(read committed):
一个事务只能读到另一个已提交事务的修改数据,并且其他事务每对该数据进行一次修改并提交,但该事务还是能查询最新值,但会出现不可重复读、幻读。
不可重复读:指对同一条数据查询时,另一个事务修改且提交,当前事务重复再次读取后数据和之前读取不一致,如下图。
幻读:指通过某个条件查询一批数据记录时,另一个事务插入一些数据且提交,当事务查询的时候会读出其他事务插入的记录。
可重复读(repeatable read):
一个事务第一次读取某条记录后,即使其他事务修改了该数据的值并提交,该事务仍是读到第一次读取的数据,而不是每次都读到不同的值,这就是可重复读。这种隔离级别解决了不可重复读,还是会出现幻读(注意:sql标准定义中会出现幻读,但是mysql的可重复读级别下,是不会出现幻读)。
串行化(serializable):
以上三种隔离级别都允许对同一条记录同时进行读-读、读-写、写-读的并发操作,可以使用serializable级别,这种隔离级别对于同一条记录的操作(除开读-读)都是串行的,所以不会出现脏读、幻读等现象。
版本链:
对于InnoDB引擎的表,聚簇索引记录包含两个必要的隐藏列。
trx_id: 每次对某条数据进行改动时,都会把对应的事务id赋值给trx_id隐藏列。
roll_pointer: 每次对某条数据进行改动时,这个隐藏列会存一个指针,可以通过该指针找到该记录修改前的信息。
版本链如图:
READVIEW:
对于使用read uncommitted隔离级别的事务来说,直接读取最新的版本就好。
对于使用serializable级别的事务来说,使用加锁的方式来访问记录。
对于read committed和repeatable read隔离级别的事务,就使用到版本链,核心问题就是:当前版本链中哪个版本是当前事务可见。
readview(读的视图和数据库的视图不一样)中包含4个重要内容:
- m_ids: 表示在生成readview时,当前系统中活跃的读写事务的事务id列表(即其他还未提交的事务id,包含当前事务id)。
- min_trx_id: 表示在生产readview时,当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
- max_trx_id: 表示在生产readview时,系统中应该分配给下一个事务的id值。(max_trx_id并不是m_ids中的最大值,事务id是递增分配的。如有事务1、2、3,当事务3提交后,那么一个新的读事务再生成readView时,m_ids包含1、2,min_trx_id为1,max_trx_id为4)。
- creator_trx_id: 表示在生产该readview的事务的事务id。
ReadView下面,访问某个版本是否可以的规则:
如果被访问版本的trx_id和readView中的creator_trx_id相同,则说明当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
如果被访问版本的trx_id小于readView中的min_trx_id的值,说明被访问版本的事务已在当前事务生成readView时已经提交,所以该版本可以被当前事务访问。
如果被访问版本的trx_id大于readView中的max_trx_id的值,说明被访问版本的事务在当前事务生成readView后才开启,所以该版本不可以被当前事务访问。
如果被访问版本的trx_id在readView的min_trx_id和max_trx_id之间,那就需要判断trx_id是否在m_ids里面,如果在,说明创建readView时,生成改版本的事务还是活跃的,不可以被访问;如果不在,说明生成该版本的事务已经被提交了,改版本可以被访问。
read committed级别下面:
每次读取数据前都重新生成一个ReadView!
事务A中select一条数据时,会生成ReadView,ReadView里面会有一个m_ids里面含有当前活跃读写的事务ID列表,然后通过对版本链查找,直到找到非m_ids列表内的事务id记录,则为已提交的事务修改,并返回该记录数据。
当事务B修改了该数据并提交事务,则在事务A内再去select的时候,会重新生成readView,此时m_ids就不会包含已提交的事务B的id,则会找到已提交的事务B的修改记录。
repeatable read级别下面:
只在第一次读取数据前生成一个ReadView!
事务A中select一条数据时,会生成ReadView,ReadView里面会有一个m_ids里面含有当前活跃读写的事务ID列表,然后通过对版本链查找,直到找到非m_ids列表内的事务id记录,则为已提交的事务修改,并返回该记录数据。
但是当事务A再去select的时候,会使用第一次生成的ReadView数据,所以就算事务B提交了修改,但此时m_ids不会改变,还是会找到之前的记录。解决不可重复读的问题。mysql中解决幻读,是通过gap锁来解决的。
MVCC(Multi-Version Concurrency Control,多版本并非控制):
指的就是在read committed和repeatable read隔离级别下,事务在执行普通SELECT操作时访问数据记录的版本链过程。可以使不同事务的读-写、写-读事务并发执行,从而提高性能。高效的读。
read committed 和 repeatable read两个级别的区别就是:
生成ReadView的时机不同,read committed每次读取都重新生成,repeatable read只在第一次读取生成,后面每次都重复使用这个readView。