什么是事务
事务(transaction)就是一组原子性的SQL查询,或者说一个独立的工作单元。如果数据库引擎能够成功地对数据库应用该组查询的全部语句,那么就执行该组查询。如果其中有任何一条语句因为崩溃或其他原因无法执行,那么所有的语句都不会执行。也就是说,事务内的语句,要么全部执行成功,要么全部执行失败。说到事务就需要理解ACID。
ACID
ACID表示原子性(atomicity)、一致性(consistency)、隔离性(isolation)和持久性(durability)。一个运行良好的事务处理系统,必须具备这些标准特征。
- 原子性:一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不能只执行其中的一部分操作,这就是事务的原子性。
- 一致性:数据库总是从一个一致性的状态转换到另外一个一致性的状态。事务最终没有提交,所以事务中所做的修改也不会保存到数据库中。
- 隔离性:一般来说,一个事务所做的修改在提交之前,对其他事务是不可见的。但是在不同的隔离级别会有不一样的效果,所以说是“一般来说”不可见的,某些情况是可见的。
- 持久性:事务一旦提交,所做的修改就会永久保存到数据库中,数据就会保存到机器磁盘里。
一个兼容ACID的数据库系统,需要做很多复杂但可能用户并没有察觉到的工作,才能确保ACID的实现。
隔离级别
在SQL标准中定义了四种隔离级别,每一种级别都规定了一个事务中所做的修改,哪些在事务内和事务间是可见的,哪些是不可见的。较低级别的隔离通常可以执行更高的并发,系统的开销也更低。
- READ UNCOMMITTED(未提交读)
在READ UNCOMMITTED级别,事务中的修改,即使没有提交,对其他事务也都是可见的。事务可以读取未提交的数据,这也被称为脏读(Dirty Read)。这个级别会导致很多问题,从性能上来说,READ UNCOMMITTED不会比其他的级别好太多,缺乏其他级别的很多好处,在实际应用中一般很少使用。 - READ COMMITTED(提交读)
大多数数据库系统的默认隔离级别都是READ COMMITTED(MySQL不是)。该级别中,一个事务从开始直到提交之前,所做的任何修改对其他事务都是不可见的。这个级别也叫不可重复读(nonrepeatable read),因为两次执行同样的查询,可能会得到不一样的结果。 - REPEATABLE READ(可重复读)
REPEATABLE READ解决了脏读的问题。该级别保证了在同一个事务中多次读取同样记录的结果是一致的。但是理论上,可重复读隔离级别还是无法解决另外一个幻读(Phantom Read)的问题。所谓幻读,指的是当某个事务在读取某个范围内的记录时,另外一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,会产生幻行(Phantom Row)。InnoDB和XtraDB存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)解决了幻读的问题。这是MySQL的默认事务隔离级别。 - SERIALIZABLE(可串行化)
SERIALIZABLE 是最高的隔离级别。它通过强制事务串行执行,避免了前面说的幻读的问题。简单来说,SERIALIZABLE会在读取的每一行数据上都加锁,所以可能导致大量的超时和锁争用的问题。实际应用中也很少用到这个隔离级别,只有在非常需要确保数据的一致性而且可以接受没有并发的情况下,才考虑采用该级别。
事务处理的术语
- 事务(Transaction):指一组SQL语句。
- 回退(Rollback):指撤销指定的SQL语句的过程。
- 提交(Commit):指将未存储的SQL语句结果写入数据库表。
- 保留点(Savepoint):指事务处理中设置的临时占位符,可以对它发布回退。
BEGIN 或 START TRANSACTION 显式地开启一个事务;
COMMIT 也可以使用 COMMIT WORK,不过二者是等价的。COMMIT 会提交事务,并使已对数据库进行的所有修改成为永久性的;
ROLLBACK 也可以使用 ROLLBACK WORK,不过二者是等价的。回滚会结束用户的事务,并撤销正在进行的所有未提交的修改;
SAVEPOINT identifier,SAVEPOINT 允许在事务中创建一个保存点,一个事务中可以有多个 SAVEPOINT;
RELEASE SAVEPOINT identifier 删除一个事务的保存点,当没有指定的保存点时,执行该语句会抛出一个异常;
ROLLBACK TO identifier 把事务回滚到标记点;
SET TRANSACTION 用来设置事务的隔离级别。InnoDB 存储引擎提供事务的隔离级别有READ UNCOMMITTED、READ COMMITTED、REPEATABLE READ 和 SERIALIZABLE。
事务处理的类型
为了满足不同应用需要,提供了多种类型的事务处理,包括自动处理事务和隐式事务。
- 自动处理事务。系统默认每个SQL命令都是事务处理,由系统自动开始并提交。执行命令 SET AUTOCOMMIT=0,用来禁止使用当前会话的自动提交,SET AUTOCOMMIT=1则开启。
- 隐式事务。当连接以隐性事务模式进行操作时,数据库引擎实例将在提交或回滚当前事务后自动启动新事务。无须描述事务的开始,只需提交或回滚每个事务。隐性事务模式生成连续的事务链。
- 用户定义事务。由用户来控制事务的开始和结束命令包括BEGIN、COMMIT、ROLLBACK等。
- 分布式事务。跨越多个服务器的事务称为分布式事务。