梁老师小课堂|谈谈数据库的事务ACID

在数据库中新建一个字段并且设置为索引列,还有删除整张表的数据,类似这些操作都是一系列操作的组合,执行后不能出现中间状态,也就是不会出现新建了字段却不是索引的情况,也不会出现只有一部分数据被删除的情况。这种保证是事务在发挥作用,虽然我们没有使用begin-transaction-commit来执行命令。

既然事务是一系列操作的组合,那两个事务的多个操作如何正确顺序执行和如何高效执行就是关键了。这就要说说事务的ACID原则了,ACID指的是原子性、一致性、隔离性、持久性。

假设有这么一个场景,用户A的初始余额是100元,用户B的初始余额是0元,用户A需要向用户B转账100元。这个场景事实上是分二步执行的,第一步是扣除用户A账号上的100元,第二步是给用户B账号的余额增加100元。最终状态是用户A余额为0元,用户B的余额为100元。

不过,在执行扣除和增加这两步时随时可能发生错误。比如业务属性不匹配,用户B的账号有敏感操作被冻结了,无法更新,所以要恢复到初始状态。又比如系统崩溃了,所以系统重启时要首先进入安全模式,已提交的事务要继续完成,未提交的事务要取消掉。这样才能保证事务操作要么全部成功,要么全部失败。

那如何恢复到初始状态或者取消未提交的事务呢?

执行操作前把之前的值备份下来,不就可以借助备份进行递向操作了嘛?没错,在数据库的体现就是Undo log回滚段。

前面描述的事务场景可能过于简单,我们考虑这么一件事,用户C在刚才的事务执行过程中给用户B成功转入了300元,也就是说同时有多个事务在执行。不幸的是,刚才的事务被回滚了,用户B的余额最终被更新成了0元。后果就是用户C的转入操作好像没发生过一样,成了一笔坏账。

这个问题的原因是原子性不能保证可见性,当前事务看不到其它事务提交的结果,这才导致了数据的不一致。事实上可以使用排它锁来保证一致性。对账号A和账号B这两个资源进行加锁,事务获得锁才能执行,执行完才释放锁。这样事务是串行化执行的,当前事务肯定是能看到前一个事务提交结果的,数据一定是强一致性的。

使用到锁就要考虑死锁问题了,死锁问题说的是两个进程在不同方向抢占相同的共享资源。我们可以通过碰撞检测来发现系统中是否存在死锁,每个进程都记录已拥有和等待中的锁,如果出现了回环,说明有死锁。解决死锁的一般办法是锁等待超时。

使用锁时除了死锁还要考虑性能问题,排它锁是简单粗暴的方法,但是性能有点不忍直视。这时就得考虑一些优化策略了,比如减少锁的覆盖范围、减少锁的持有时间、使用并行代替串行。

数据库的设计大师正是考虑到这些,才引入了事务隔离性。

第一种事务隔离性是序列化读写。所有的事务放入到队列中依次执行,比如读写-写读-读读-写写。

第二种是读已提交。当前事务只能读取到其他事务已提交的结果,这种隔离下读-读、读-写都是可以并行执行的,因为当前事务读取的数据是写操作的结果。

第三种是可重复读。在同一个事务中,多次读取到的结果是一致的。这种隔离下读-读、读-写都是可以并行执行的。

第四种是读未提交。当前事务能看到其他事务还没有提交的中间状态,这种隔离下,只有写锁,读是不加锁的,所以除了写-写,读-写、写-读、读-读都是可以并行的。代价是出现脏读。

透过这四种事务隔离,明显能看到读写锁带来的收益,那能不能再优化下呢?

答案是可以的,秘决就是多版本并发控制MVCC,它的本质是写时复制Copy on write。行记录每次修改时都会产生一个快照和一个版本号,版本号是单向增长的逻辑时间戳,用来表示先后顺序。而读操作只会读取到早于当前事务版本的记录。显然,这种技巧非常适合读多写少的场景,而且能达到读未提交的并发度,隔离级别更好。

既然读-写、写-读、读-读都是可以并行的,写-写也能并行就更好了。

我们先来看下写-写并行会有什么问题。假设用户A要给用户B转账100元,用户B也要给用户A转账100元,考虑到事务间原子操作顺序的不可见性,用户A的余额可能会在原来基础上增加了100元,银行得损失100元。针对这种情况,需要借助乐观锁的思想来保证数据的一致性,针对同一行记录,只有高版本的事务更新能成功,低版本的事务更新得回滚掉。缺点是并发高时失败率高,需要不断重试。

除了事务隔离,数据库设计的大师为了提高并发效率,还做了很多优化。比如每次写操作并不直接持久化到磁盘中,而是暂时存放在易丢失的内存中,然后通过一定的机制异步同步到磁盘。这样就保证了数据的持久性,确保事务一旦提交,操作肯定会固化到数据库中。类似生活中这种场景,餐馆老板娘很忙的时候,就把每笔交易写在黑板上,当老板娘空闲、黑板写满或者餐馆打烊后再整理写入到账本中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
曾经使用过Sybase SQL Anywhere 11数据同步采用内置插件MobiLink居于日志事务流形式的通讯,优点速度快、准确、夸平台,网络开销极低情况下保证通讯顺畅不丢包。由于工作原因开始接触MSSQL,有人说MSSQL没有此功能、类似的功能不好用等诸多说法,也很好奇全国某些知名软件开发上采用MSSQL,但数据库之间通讯还采用自己写通讯程序完成数据库之间数据交换,效率低、操作繁琐、数据传输重复、漏传、致命性错误、人工干预滞后等诸多问题。我想那么大一个微软公司不可能没有办法解决此问题,最近几天本开始研究了一下MSSQL复制服务,通过发布和订阅达到数据通讯或者备份目的,首先我点评一下MSSQL复制服务,整体来说感觉还不错,缺点是不启动管理器没法监控发布和订阅情况(也许本人不够专业,没有发现)。复制服务需要发布、分发、订阅三部分组成,发布与分发可以集成在一起,如果订阅端较多建议独立分发。 测试环境Windows2008ServerR2+MSSQL2008R2SP3,两台计算机,发布与分发一体,然后一个订阅端。 1、 发布与分发服务器计算机名:Publish_Server IP地址:192.168.20.1 2、 订阅服务器计算机名:Subscribe_Server IP地址:192.168.20.2 由于没有域控环境,首先在两台机器的hosts文件的尾部加入: 192.168.20.1 Publish_Server 192.168.20.2 Subscribe_Server 加入的原因是没有域控和DNS服务器,通过机器名解析能快速准确的解析到IP地址只有在hosts文件中做文章,我想这个你应该懂的! 如何安装MSSQL2008R2我就不在说了自己到百度搜索,首先关闭两台机器本机自带防火墙或者把1433、21端口加入防火墙策略,1433端口不用说了吧!21是用于FTP第一次分发快照的端口。 SQL2008提供的发布类型有4种:(我先照搬微软的说明) 1、 快照发布:发布服务器按预定的时间间隔向订阅服务器发送已发布的数据库快照。 2、 事务发布:在订阅服务器收到已发布数据的初始快照后,发布服务器将事务流式 传输到订阅服务器。 3、 具有可更新订阅的事务发布:在 SQL Server 订阅服务器收到已发布数据的初始快照后,发布服务器将事务流式传输到订阅服务器。来自订阅服务器的事务被应用于发布服务器。 4、 合并发布:在订阅服务器收到已发布数据的初始快照后,发布服务器和订阅服务器可以独立更新已发布数据。更改会定期合并。Microsoft SQL Server Compact Edition 只能订阅合并发布。 (1)快照发布,这种每次订阅服务器都去下载完整快照这效率低,对网络要求也高,个人觉得不可取。(2)事务发布,只要订阅服务器收到初始快照后,订阅服务器将用事务流的方式到发布上取数据,速度相当快网络和机器性能好的情况毫秒级的响应,这种模式数据是单向的,发布服务器到订阅服务器,订阅服务器端不能对数据进行修改,即使进行了修改是也暂时的,下次发布服务器对应数据做了更新后订阅服务器数据将被同步。(3)具有可更新订阅的事务发布,这个研究了半天没有成功,还要在订阅服务器上把分发服务器作为链接服务器,本人愚昧没有实验成功。(4)合并发布,数据在发布和订阅端都可以进行修改,而且可以自动合并。根据同场景本人推荐:事务发布和合并发布,记住它们最大的区别就是事务发布是数据单向传送、合并发布是数据双向传送。 注意任何时候MSSQL叫你输入服务器名称都要用实例名不能输入IP地址(一台机器上只安装了一个实例的话实例名就是计算机名,这下知道hosts文件的重要性了吧,谁叫我们不在域控制器下呢!其实在微软操作系统中计算机名比IP高一级,但我们在使用中往往把IP地址看得比计算机更重要,这就是没有域控制器的原因。为了计算机名能快速、准确的解析到就乖乖的去hosts文件中添加吧!)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值