事务是数据库一组不可分割的操作序列,实现最终一致性。
事务也是数据库并发控制的最小单位。
事务的4个特性:
- 原子性Atomicity,要么全部成功,要么全部失败,mysql通过回滚的方式实现要失败就全部失败,要实现回滚则需要每修改一次,就记录一条对应的回滚命令,并存储到undo_log中
- 一致性Consistency
- 隔离性Isolation 事务在并发中,保证互不干扰;mysql通过各种锁和MVCC机制进行数据隔离
- 持久性Durability 保证事务成功,数据也会写入成功;mysql的表数据是分散到磁盘的,若要保证事务成功就立即写入到表文件,会对性能有很大影响,通常是写到缓存中,等待定时刷入磁盘。 这样就没法保证持久性,所以mysql通过redo_log记录修改命令,由于是直接存储命令,并且是线性存储,速度很快。
事务可并发能力越高,则安全性也就越差,会带来脏写、脏读、不可重复读、幻读。
不同的业务对并发和安全性要求各不相同,所以数据库设置了4个隔离级别供用户使用
读未提交 RU
A事务可以读取B事务已经执行的修改,无论B事务是否已经提交。
对于事务稍微大一点的,涉及多次修改或回滚操作,会经常读到其他事务回滚的值,或是写了一半的值(脏读)。
最高的并发能力,但几乎放弃了事务的隔离性,对于简单业务,只有插入没有状态数值更新的业务,如数据采集,日志记录等,基本上事务之间也没业务交集,就可以使用该级别事务。
读已提交RC
A事务任意时刻都能读取最新已提交的值。所以事务过程中,读取的值随时都会变(不可重复读),需要业务开发时注意。 对于某些需要停滞时空去执行的业务就不太合适了,比如报表统计,科研数据计算,如果执行中途读到了新值(不可重复读),则会造成结果混乱。
很高的并发,解决了脏读,若在业务端实现重复读 幻读问题,可以有很高的性能,适用于互联网业务。
set session tx_isolation = 'read-committed';
可重复读RR
当事务开启后,停滞时空,事务提交前,永远只能读取到事务开启时刻,已提交过的值。那些未提交,或以后提交的值,都无法读取到(MVCC实现);这样就解决了不可重复读,部分幻读。
当可重复读事务修改某个值时, 很可能该值早已经被其他事务修改, 但事务自身无法感知,若直接提交,会覆盖其他事务已经提交的值。 这样只能通过乐观锁,加版本号解决,让事务提交失败。
默认选择,并发稍差,通过MVCC机制实现了可重复读,适用于企业软件业务。
set session tx_isolation = 'repeatable-read';
串行化Serializable
串行化执行,无并发能力,也就不用担心安全问题。
通过给查询语句自动加读锁实现, 当两个事务都读取时,可以并发读, 若有事务更新操作,需要加写锁,会等待读锁释放,从而变成了串行化。
set session tx_isolation = 'serializable';