何为一致性?
初学数据库事务时老师讲到数据库四大特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。
原子性和持久性概念基本秒懂,隔离性也好理解。但这个一致性实在让人摸不着头脑。什么和什么一致?体现在哪里?
先看看官方的解释:
一致性是指事务必须使数据库从一个一致性状态变换到另一个一致性状态,也就是说一个事务执行之前和执行之后都必须处于一致性状态。
我让你解释一致性,你又拿一致性来解释一致性。这不是在套娃吗?
于是百度了一下,发现好多半吊子博主,把原子性的解释套在一致性上,自己满脑子浆糊,还大言不惭的误人子弟。
还有些博主估计段位太高,不屑把话说的太明白,他们是这么解释一致性的:“一致性是指数据处于一种语义上的有意义且正确的状态。一致性是对数据可见性的约束,保证在一个事务中的多次操作下数据中间状态对其他事务不可见的。因为这些中间状态,是一个过渡状态,与事务的开始状态和事务的结束状态是不一致的。”
我反正是更晕了。
于是继续百度之,有人用AB转账举例,AB两个账户总共5000元,不论怎么A怎么给B转,B怎么给A转,AB账户合计总额还是5000.这就是一致性。貌似有些意思了,但终归感觉说的不是很透彻。
最后终于看到了一句解释点醒了我。原话忘了,但含义总结如下:
一致性是数据库处理前后结果应与其所抽象的客观世界中真实状况保持一致。这种一致性是一种需要管理员去定义的规则。管理员如何指定规则,数据库就严格按照这种规则去处理数据。
就拿那个老掉牙的AB转账来进一步解释,如果说AB两账户总金额5000就是数据库的一致性规则,那么我能不能把A账户转走10000给B,让B账户有10000,而A剩下-5000?从数学上来看完全正确,但这显然是不符合常理的。而这种抽象世界的常理,就是所谓的一致性
下面我们开始讲数据库的一致性是怎么实现的?
唯一索引
给学号添加唯一索引,那么创建学生信息时,如果已存在相同学号,则创建失败
外键约束
给文章表的用户ID创建外键,创建文章时,如果不存在对应的用户,则创建失败;删除用户时,如果文章表有该用户的文章,则无法删除用户,或者将用户与文章一起删除
触发器
插入文章的浏览记录时,使用触发器去更新对应文章的浏览量(保证每增加一条浏览记录,对应文章浏览量+1)
指定数据类型
设置年龄的类型为非负整数,若年龄为负数、字母时,则保存失败
设置默认值
如果没有指定文章的发布时间,则默认以文章记录的插入时间作为发布时间
设置字段不能为空
设置文章的发布时间NOT NULL,没指定发布时间,或发布时间为NULL时,文章创建失败
事务的原子性
事务的原子性是指同一个事务中的操作,要么都成功,要么都失败。以A向B转账100元转账为例,需要执行以下2个操作:
1).将A的余额减少100元;
2).将B的余额增加100元。
这两个操作要么都成功,要么都失败,否则最后账目就会对不上(破坏一致性)。事务的原子性可以保证以上两个操作同时成功,或者同时失败
事务的隔离性
在并发的情况下,只靠事务的原子性并不能保证一致性。举个例子,A有100元,A同时向B发起两笔转账请求,转账金额分别是99元和1元。
两笔转账都执行成功了,理论上A的余额为0,但实际上A的余额被请求2修改为99元,数据的一致性被破坏了!
再举一个例子,A同时发起两笔转账,其中一笔因为某些原因操作失败,事务回滚,而另外一笔转账执行成功。执行时间线如下:
在这个场景下,A实际转账成功了1元,但是A的余额最终为0,数据的一致性又被破坏了!
事务的隔离性可以在多个事务并发执行的情况下,通过加锁等方式,保证数据的一致性