事务(Transaction)及其ACID属性
事务是由一组SQL语句组成的逻辑处理单元,事务具有以下4个属性,通常简称为事务的ACID属性。
1.原子性(Atomicity):事务是一个原子操作单元,在同一个事物中其对数据的修改,要么全都执行,
要么全都不执行。不会结束在中间某个环节执行一部分。事务在执行过程中发生错误,会被回滚(Rollback)到
事务开始前的状态,就像这个事务从来没有执行过一样。
2.一致性(Consistent):在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规
则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构(如B树索引或双向链表)
也都必须是正确的。当然这个含义中也隐含着对开发者的要求,就是不能写出错误的事务逻辑,比如银行的转账不
能只加钱不减钱,这是应用层面的一致性要求。比如A账户想B账户转账5000元:①检测A账户余额 > 5000元 ②A账
户余额减去 5000元 ③B账户余额增加5000元。一致性保证A和B的金钱总计是不会变的。
3.隔离性(Isolation):数据库允许多个并发事务同时对其数据进行读写和修改的能力,隔离性可以防
止多个事务并发执行时由于交叉执行而导致数据的不一致。事务隔离分为不同级别,包括读未提交(Read
uncommitted)、读提交(read committed)、可重复读(repeatable read)和串行化(Serializable)。
4.持久性(Durable):事务完成之后,它对于数据的修改是永久性的,需要将提交的事务持久化到磁
盘。即使出现系统故障也能够保持。
思考:
一致性是指数据处于一种语义上的有意义且正确的状态。一致性是对数据可见性的约束,保证在一个事务中的多次操作的数据中间状态对其他事务不可见的。因为这些中间状态,是一个过渡状态,与事务的开始状态和事务的结束状态是不一致的。
举个粒子,张三给李四转账100元。事务要做的是从张三账户上减掉100元,李四账户上加上100元。一致性的含义是其他事务要么看到张三还没有给李四转账的状态,要么张三已经成功转账给李四的状态,而对于张三少了100元,李四还没加上100元这个中间状态是不可见的。
那么反驳的声音来了:
要么转账操作全部成功,要么全部失败,这是原子性。从例子上看全部成功,那么一致性就是原子性的一部分咯,为什么还要单独说一致性和原子性?
你说的不对。在未提交读的隔离级别下是事务内部操作是可见的,明显违背了一致性,怎么解释?
好吧,需要注意的是:
原子性和一致性的的侧重点不同:原子性关注状态,要么全部成功,要么全部失败,不存在部分成功的状态。而一致性关注数据的可见性,中间状态的数据对外部不可见,只有最初状态和最终状态的数据对外可见
隔离性是多个事物的时候, 相互不能干扰,一致性是要保证操作前和操作后数据或者数据结构的一致性,而我提到的事务的一致性是关注数据的中间状态,也就是一致性需要监视中间状态的数据,如果有变化,即刻回滚
原子性、一致性、隔离性、持久性只是数据库事务的属性,而真正跟并发事务有关的是隔离性
事务的隔离性是通过锁实现的,而事务的原子性、一致性、持久性则是通过事务日志(redo 和 undo)实现的。
改一致性:
保证数据库的一致性是数据库管理系统的一项功能.比如有两个表(员工\职位),员工表中有员工代码、姓名、
职位代码等属性,职位表中有职位代码、职位名称、职位等级等属性。你在其中员工表中进行了插入操作,你插入
了一个新员工的信息,而这个新员工的职位是公司新创建的一个职位。如果没有一致性的保证,就会出现有这么一
个员工,但是不知道他到底担当什么职责!这个只是它的一个小小方面。上表中的转账问题也是,事物完成数据上
必须一致完整
读一致性:
读一致性也是数据库一致性的一个重要方面,在实际中,我们会遇到这种情况:我们对一个表中的某些数据进行
了更新操作,,但是还没有进行提交,这时另外一个用户读取表中数据.这个时候就出现了读一致性的问题:到底是读
什么时候的数据呢?是更新前的还是更新后的?在DBMS中设有临时表,它用来保存修改前的值,在没有进行提交前读
取数据,会读取临时表中的数据,这样一来就保证了数据是一致的.(当前用户看到的是更新前的值)
但是还有一种情况:用户user1对表进行了更新操作,用户user2在user1还没有进行提交前读表中数据,而且
是大批量的读取(打个比方:耗时3分钟)而在这3分钟内user1进行了提交操作,那又会产生什么影响呢?这个时候怎
么保证读写一致性呢?这个时候DBMS就要保证有足够大的临时表来存放修改前的数值,,以保证user2读取的数据是
修改前的一致数据.然后下次再读取时候就是更新后的数据了.
还有一种情况就是user1 9:00对标进行读取,数据量太大读取需要5分钟,而在9:02的时候user1还没有读
到最后一条数据时user2对最后一条数据进行修改,比如由1改成2,并马上进行提交了,问:9:05user1读取数
据完成后,读到的是1还是2,答案肯定是1,user1读到的是9:00那一刻的数据,这也是数据库一致性读的提现
简单的理解并发事务(和java并发对比理解)
事务是由一组SQL语句组成的逻辑处理单元======类似于java的一套逻辑操作 即:事物类似于线程
事务访问的数据库中的数据======类似于java中线程访问的共享数据
多个事务并发访问数据库中的数据======类似于java中多线程访问共享资源
java中多线程是通过锁来保护共享数据来保证线程安全的
数据库则是通过隔离级别(也是通过锁来实现的)来解决并发事物带来的问题
并发事务处理带来的问题
相对于串行处理来说,并发事务处理能大大增加数据库资源的利用率,提高数据库系统的事务吞吐量,从而可以支持可以支持更多的用户。
但并发事务处理也会带来一些问题,主要包括以下几种情况。
1.更新丢失(Lost Update)
[1]Transaction01将某条记录的AGE值从20修改为30提交。
[2]Transaction02将某条记录的AGE值从20修改为40提交。
[3]Transaction02的修改覆盖了Transaction01的修改
2.脏读(Dirty Reads) 读未提交
[1]Transaction01将某条记录的AGE值从20修改为30。
[2]Transaction02读取了Transaction01更新后的值:30。
[3]Transaction01回滚,AGE值恢复到了20。
[4]Transaction02读取到的30就是一个无效的值。
一句话:事务A读取到了事务B已修改但尚未提交的的数据,还在这个数据基础上做了操作。此时,如果B事务回滚,
A读取的数据无效,不符合一致性要求。
3.不可重复读(Non-Repeatable Reads) 读已提交
[1]Transaction01读取了AGE值为20。
[2]Transaction02将AGE值修改为30。
[3]Transaction01再次读取AGE值为30,和第一次读取不一致。
一个事务在读取某些数据后的某个时间(还未提交,但是没有进行更新操锁,没有锁表,其他事物可以更新之前查询过的表:
之前select * from .... for update可以避免其他的事物操作本条记录),再次读取以前读过的数据,
却发现其读出的数据已经发生了改变、或某些记录已经被删除了!这种现象就叫做“不可重复读”。
一句话:事务A读取到了事务B已经提交的修改数据,不符合隔离性
4.幻读(Phantom Reads)
[1]Transaction01读取了STUDENT表中的一部分数据。
[2]Transaction02向STUDENT表中插入了新的行。
[3]Transaction01读取了STUDENT表时,多出了一些行。
一个事务按相同的查询条件重新读取以前检索过的数据,却发现其他事务插入了满足其查询条件的新数据,这种现象就称为“幻读”
一句话:事务A读取到了事务B体提交的新增数据,不符合隔离性。
多说一句:幻读和脏读有点类似,应该是和不可重复读类似吧?
脏读是事务B里面修改了数据,
幻读是事务B里面新增了数据。
事物的隔离级别
(有四个级别 1 2 4 8 mysql默认隔离级别为4)
①读未提交:READ UNCOMMITTED 1
允许Transaction01读取Transaction02未提交的修改。会有脏读 不可重复读 幻读
②读已提交:READ COMMITTED 2
要求Transaction01只能读取Transaction02已提交的修改。 会有不可重复读 幻读
③可重复读:REPEATABLE READ 4
确保Transaction01可以多次从一个字段中读取到相同的值,即Transaction01执行期间禁止其它事务对这个字段进行更新(自己试验不是禁止其他事务修改,而是Transaction01读取不到其他失误的修改)
会有幻读
④串行化:SERIALIZABLE 8
确保Transaction01可以多次从一个表中读取到相同的行,在Transaction01执行期间,禁止其它事
务对这个表进行添加、更新、删除操作。
可以避免任何并发问题,但性能十分低下。
事物的常见传播行为
①propagation=Propagetion.REQUIRED
a()方法调用b()方法
如果a()方法没有事物,那么b()方法自己开启一个事物
如果a()方法有事物,那么b()方法加入a()方法的事物中
②propagation=Propagetion.REQUIRES_NEW
a()方法调用b()方法
不管a()方法是否有事物,b()方法总为自己开启一个新的事物
如果a()方法有事物,b()方法事物在执行时,a()方法事物需要挂起,等b()方法事物结束后,a()方法事物继续执行