首先,我们要知道什么是事务。事务是一个有边界的工作序列,什么时间开始,什么时间结束,都有着明确的定义。
如:张三向李四通过银行卡转账的事务,从张三从卡中扣钱开始,事务就开始了,直到李四正常收到扣除的钱,事务
才结束。
其次,一次事务中,所有相关资源在事务开始和结束时,都需要保持一致。例如:一个买东西的人,虽然他的钱少
了,但是他却得到了其他东西。他所拥有的资产总和是不变的。
而且,每个事务都必须保证要么全部完成,要么什么都做不成。
事务的4个特性,ACID:
软件事务经常使用ACID的属性来描述。
原子性(Atomicity):在一个事务里,动作序列的每个步骤都必须要么全部成功,要么所有的工作都讲回滚。部分
完成不是一个事务概念。
一致性(Consistency):在事务开始和完成的时候,系统的资源都必须处于一致,没有被破坏的状态。比如:张三
借出的钱,不能中途就不知所踪了……
隔离性(Isolation):一个事务,直到它被成功提交之后,它的结果对于任何其他的事务才是可见的。
持久性(Durability):一个已提交事务的任何结果都必须是永久性的。即“在任何系统崩溃的情况下都能保存下
来”。
一般为了处理最大的吞吐率,现代的事务处理系统都会将事务设计成保证事务尽可能的短。为此,要尽可能不让事务
跨域多个请求。跨域多个请求的事务称之为“长事务”。举个例子:我们原本业务逻辑中有事务,但是对业务逻辑的事
务控制中需要依赖于第三方系统的结果,那么这时就是长事务。
因此,通常在请求开始时启动事务,在请求结束时提交事务。这样的请求事务是一个非常好的简单模型。只适合于一
次请求,只需把方法标记成事务化的,就能在很多计算环境中方便实现。也就是:“事务脚本模式”,但是这种模式只
针对于业务相对简单的情况。
除了使用“事务脚本模式”尽量简化事务外,还有一种办法就是尽可能晚的打开事务。使用“延迟事务”思想,在事务外
完成读取数据的操作,只在修改数据的时候启动事务。这样做最大的好处在于减少事务执行的时间。在启动事务和第
一次写操作之间有较长时间间隔的情况下,这样做更能增加系统的灵活性。但是,这也意味着在事务启动前没有任何
并发控制机制,可能会导致不一致读问题。
事务的4中隔离级别:
事务的隔离性,要求事务必须要在它处理成功后,它的结果其他事务才是可见的。那么如果我们系统采用完全隔离,
能够得到可串行化的事务。当可以并发执行并且结果与以某种顺序依次执行的结果相同时,事务就是可串行化的
(Serializable)。可串行化的结果不能保证得到什么,但是能保证肯定是正确的。
大多数事务系统使用SQL标准中定义的4中隔离级别。可串行化是最强的级别,其它每个级别都允许某种程度上的不
一致读。
仅次与可串行化级别的是可重复读(repeatable read),但是这时允许幻读。所谓幻读是指当事务不是独立执行时发
生的一种现象,例如第一个事务对一个表中的数据进行了修改,比如这种修改涉及到表中的“全部数据行”。同时,第
二个事务也修改这个表中的数据,这种修改是向表中插入“一行新数据”。那么,以后就会发生操作第一个事务的用户
发现表中还有没有修改的数据行,就好象发生了幻觉一样。一般解决幻读的方法是增加范围锁RangeS。
下一个级别是读已提交(read committed),它允许不可重复读(uprepeatable reads),所谓不可重复读是指在数据
库访问中,一个事务范围内两个相同的查询却返回了不同数据。在一个事务内,多次读同一个数据。在这个事务还没
有结束时,另一个事务也访问该同一数据。那么,在第一个事务的两次读数据之间。由于第二个事务的修改,那么第
一个事务读到的数据可能不一样,这样就发生了在一个事务内两次读到的数据是不一样的,因此称为不可重复读,即
原始读取不可重复。对于数据库来说,发现不可重复读要比发现幻读容易一些,因此可重复读比读已提交有更好的正
确性(可重复读只是发生的是修改后的读取幻像,而读已提交则可能发生重复读取后的修改问题),但灵活度稍弱
些。但是这种隔离级别使用最为广泛。
最低的隔离级别是读未提交(read uncommitted),允许脏读(dirty reads)。这时可以读取其他事务中还未提交的
数据。脏读又称无效数据的读出,是指在数据库访问中,事务T1将某一值修改,然后事务T2读取该值,此后T1因为
某种原因撤销对该值的修改,这就导致了T2所读取到的数据是无效的。
脏读就是指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个
事务也访问这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据
是脏数据,依据脏数据所做的操作可能是不正确的。
4种隔离级别可能引发的各种读错误,如下图所示:
如何保证正确性,以及如何尽量保证系统的灵活性,这需要你根据具体的情况,具体的设置,做到风险和性能之间的
平衡。