概述
事务(Transaction)是在同一个处理单元中,由一系列对数据进行访问与更新的操作所组成的一个基本程序执行逻辑单元。数据库事务其实主要做了以下两方面的事:
- 一是保证一致性结果,能在发生异常的时候快速恢复,也就是回滚
- 二是并发访问的时候可以提供隔离(后面会有事务的隔离等级)
- ACID
事务具有4个基本特征,分别是:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Duration),简称ACID。
- 隔离级别
ACID这4个特征中,最难理解的是隔离性。在标准SQL规范中,定义了4个事务隔离级别,不同的隔离级别对事务的处理不同。4个隔离级别分别是:读未提及(READ_UNCOMMITTED)、读已提交(READ_COMMITTED)、可重复读(REPEATABLE_READ)、顺序读(SERIALIZABLE)。
- 事务并发引起的问题
数据库在不同的隔离性级别下并发访问可能会出现以下几种问题:脏读(Dirty Read)、不可重复读(Unrepeatable Read)、幻读(Phantom Read)。
ACID
1. 原子性(Atomicity)
事务的原子性是指事务必须是一个原子的操作序列单元。事务中包含的各项操作在一次执行过程中,只允许出现两种状态之一。
- 全部执行成功
- 全部执行失败
任何一项操作都会导致整个事务的失败,同时其它已经被执行的操作都将被撤销并回滚,只有所有的操作全部成功,整个事务才算是成功完成。
2. 一致性(Consistency)
事务在完成时,必须使所有数据都保持一致状态。也就是说一个事务执行之前和执行之后都应该保持一致性状态。银行转帐的例子:一共1000元,不管转几次总和都应该是1000元。满足完整性的约束条件。
怎么做到的:
- 数据库机制层面
在一个事务执行之前和执行之后,数据会符合你设置的约束(唯一约束、外键约束、Check 约束等)和触发器设置。 - 业务层面
对于业务层面来说就是保持业务等一致性,就比如上面钱的总和要一致。
3. 隔离性(Isolation)
事务的隔离性是指在并发环境中,并发的事务是互相隔离的,一个事务的执行不能被其它事务干扰。也就是说,不同的事务并发操作相同的数据时,每个事务都有各自完整的数据空间。
一个事务内部的操作及使用的数据对其它并发事务是隔离的,并发执行的各个事务是不能互相干扰的。
隔离性分4个级别,下面会介绍。
4. 持久性(Duration)
事务的持久性是指事务一旦提交后,数据库中的数据必须被永久的保存下来。即使服务器系统崩溃或服务器宕机等故障。只要数据库重新启动,那么一定能够将其恢复到事务成功结束后的状态。
事务隔离级别
1. 读未提交(READ_UNCOMMITTED)
读未提及,该隔离级别允许脏读取,其隔离级别是最低的。换句话说,如果一个事务正在处理某一数据,并对其进行了更新,但同时尚未完成事务,因此还没有提交事务;而以此同时,允许另一个事务也能够访问该数据。
脏读示例:
在事务A和事务B同时执行时可能会出现如下场景:
时间 | 事务A(存款) | 事务B(取款) |
---|---|---|
T1 | 开始事务 | —— |
T2 | —— | 开始事务 |
T3 | —— | 查询余额(1000元) |
T4 | —— | 取出1000元(余额0元) |
T5 | 查询余额(0元) | —— |
T6 | —— | 撤销事务(余额恢复1000元) |
T7 | 存入500元(余额500元) | —— |
T8 | 提交事务 | —— |
余额应该为1500元才对。请看T5时间点,事务A此时查询的余额为0,这个数据就是脏数据,他是事务B还未提交时的查到数据。
2. 读已提交(READ_COMMITTED)
就是一个事务要等另一个事务提交后才能读取数据。若有事务对数据进行更新(UPDATE)操作时,读操作事务要等待这个更新操作事务提交后才能读取数据,可以解决脏读问题。
不可重复读示例
可是解决了脏读问题,但是还是解决不了可重复读问题。
时间 | 事务A(存款) | 事务B(取款) |
---|---|---|
T1 | 开始事务 | —— |
T2 | —— | 开始事务 |
T3 | —— | 查询余额(1000元) |
T4 | 查询余额(1000元) | —— |
T5 | —— | 取出1000元(余额0元) |
T6 | —— | 提交事务 |
T7 | 查询余额(0元) | —— |
T8 | 提交事务 | —— |
如上图,一个事务范围内两个相同的查询却返回了不同数据,这就是不可重复读。那怎么解决可能的不可重复读问题?
3. 可重复读(REPEATABLE_READ)
就是在开始读取数据(事务开启)时,不再允许修改操作。重复读可以解决不可重复读问题。可重复读就是保证在事务处理过程中,多次读取同一个数据时,该数据的值和事务开始时刻是一致的。不可重复读对应的是修改,即UPDATE操作,我们不让它UPADTE就OK了。但还是可能还会有幻读问题。因为幻读问题对应的是插入INSERT操作,而不是UPDATE操作。
幻读
幻读就是指同样的事务操作,在前后两个时间段内执行对同一个数据项的读取,可能出现不一致的结果。
时间 | 事务A(统计总存款) | 事务B(存款) |
---|---|---|
T1 | 开始事务 | —— |
T2 | —— | 开始事务 |
T3 | 统计总存款(10000元) | —— |
T4 | —— | 存入100元(INSERT一条数据) |
T5 | —— | 提交事务 |
T6 | 提交总存款(10100) | —— |
T7 | 提交事务 | —— |
银行工作人员在一个事务中多次统计总存款时看到结果不一样。如果要解决幻读,那只能使用顺序读了。
4. 顺序读(SERIALIZABLE)
顺序读是最严格的事务隔离级别。它要求所有的事务排队顺序执行,即事务只能一个接一个地处理,不能并发。
事务隔离级别对比
事务隔离级别 | 脏 读 | 不可重复读 | 幻 读 |
---|---|---|---|
读未提及(READ_UNCOMMITTED) | 允许 | 允许 | 允许 |
读已提交(READ_COMMITTED) | 禁止 | 允许 | 允许 |
可重复读(REPEATABLE_READ) | 禁止 | 禁止 | 允许 |
顺序读(SERIALIZABLE) | 禁止 | 禁止 | 禁止 |
4种事务隔离级别从上往下,级别越高,并发性越差,安全性就越来越高。
一般数据默认级别是读以提交或可重复读。