mysql 主从复制如何保证数据一致性

 

引言:前面我们有文章介绍如何实现MySQL的主从复制,今天来介绍下如何保证MySQL主从数据的一致性。MySQL主从复制原理直白一点来说,就是master写入数据时会留下写入日志,slave根据master留下的日志模仿其数据执行过程进行数据写入。了解了MySQL主从复制的原理,可以清楚的了解到,有两个步骤可能导致主从不一致:

  1、mater日志写入不成功导致slave不能正常模仿。
  2、slave根据master日志模仿时写入不成功。

今天我们就从这两个维度去解决主从不一致的问题。

一、保证MySQL(master端)日志和数据的统一性,处理掉电、宕机等异常情况。

多哔哔几句
1、MySQL作为一个可插拔的数据库系统,支持插件式的存储引擎,在设计上分为Server层和Storage Engine层。
2、在Server层,MySQL以events的形式记录数据库各种操作的Binlog二进制日志,其基本核心作用有:复制和备份。除此之外,我们结合多样化的业务场景需求,基于Binlog的特性构建了强大的MySQL生态,如:DTS、单元化、异构系统之间实时同步等等,Binlog早已成为MySQL生态中不可缺少的模块。
3、在Storage Engine层,InnoDB作为比较通用的存储引擎,其在高可用和高性能两方面作了较好的平衡,早已经成为使用MySQL的首选(PS:官方从MySQL 5.5.5开始,将InnoDB作为了MySQL的默认存储引擎 )。和大多数关系型数据库一样,InnoDB采用WAL技术,即InnoDB Redo Log记录了对数据文件的物理更改,并保证总是日志先行,在持久化数据文件前,保证之前的redo日志已经写到磁盘。Binlog和InnoDB Redo Log是否落盘将直接影响实例在异常宕机后数据能恢复到什么程度。InnoDB提供了相应的参数来控制事务提交时,写日志的方式和策略,例如:

innodb_flush_method:控制innodb数据文件、日志文件的打开和刷写的方式,建议取值:fsync、O_DIRECT。
innodb_flush_log_at_trx_commit:控制每次事务提交时,重做日志的写盘和落盘策略,可取值:0,1,2。
当innodb_flush_log_at_trx_commit=1时,每次事务提交,日志写到InnoDB Log Buffer后,会等待Log Buffer中的日志写到Innodb日志文件并刷新到磁盘上才返回成功。
sync_binlog:控制每次事务提交时,Binlog日志多久刷新到磁盘上,可取值:0或者n(N为正整数)。
不同取值会影响MySQL的性能和异常crash后数据能恢复的程度。当sync_binlog=1时,MySQL每次事务提交都会将binlog_cache中的数据强制写入磁盘。
innodb_doublewrite:控制是否打开double writer功能,取值ON或者OFF。
当Innodb的page size默认16K,磁盘单次写的page大小通常为4K或者远小于Innodb的page大小时,发生了系统断电/os crash ,刚好只有一部分写是成功的,则会遇到partial page write问题,从而可能导致crash后由于部分写失败的page影响数据的恢复。InnoDB为此提供了Double Writer技术来避免页断裂(partial write)的发生。
innodb_support_xa:控制是否开启InnoDB的两阶段事务提交.默认情况下,innodb_support_xa=true,支持xa两段式事务提交。

通过以上哔哔,我们得出以下配置:

#以下配置保证bin-log写入后事务提交流程会变成两阶段提交,这里的两阶段提交并不涉及分布式事务,mysql把它称之为内部xa事务
innodb_support_xa=ON
#以下配置能够保证不论是MySQL Crash 还是OS Crash 或者是主机断电重启都不会丢失数据
innodb_doublewrite=ON
#以下配置保证每次事务提交后,都能实时刷新到磁盘中,尤其是确保每次事务对应的binlog都能及时刷新到磁盘中,只要有了binlog,InnoDB就有办法做数据恢复,不至于导致主从复制的数据丢失
innodb_flush_log_at_trx_commit = 1
sync_binlog = 1

mysql配置

二、保证MySQL(slave端)同步时和master端保持一致。

1、异步复制

主库在执行完客户端提交的事务后会立即将结果返给给客户端,并不关心从库是否已经接收并处理,这样就会有一个问题,主如果crash掉了,此时主上已经提交的事务可能并没有传到从库上,如果此时,强行将从提升为主,可能导致“数据不一致”。早期MySQL(5.5以前)仅仅支持异步复制。

2、半同步复制

MySQL在5.5中引入了半同步复制,主库在应答客户端提交的事务前需要保证至少一个从库接收并写到relay log中,半同步复制通过rpl_semi_sync_master_wait_point参数来控制master在哪个环节接收 slave ack,master 接收到 ack 后返回状态给客户端,此参数一共有两个选项 AFTER_SYNC & AFTER_COMMIT。

rpl_semi_sync_master_wait_point=WAIT_AFTER_COMMIT

rpl_semi_sync_master_wait_point为WAIT_AFTER_COMMIT时,commitTrx的调用在engine层commit之后,即在等待Slave ACK时候,虽然没有返回当前客户端,但事务已经提交,其他客户端会读取到已提交事务。如果Slave端还没有读到该事务的events,同时主库发生了crash,然后切换到备库。那么之前读到的事务就不见了,出现了数据不一致的问题。如果主库永远启动不了,那么实际上在主库已经成功提交的事务,在从库上是找不到的,也就是数据丢失了。

PS:早在11年前后,阿里巴巴数据库就创新实现了在engine层commit之前等待Slave ACK的方式来解决此问题。

3、全同步复制

MySQL官方针对上述问题,在5.7.2引入了Loss-less Semi-Synchronous,在调用binlog sync之后,engine层commit之前等待Slave ACK。这样只有在确认Slave收到事务events后,事务才会提交。

rpl_semi_sync_master_wait_point=WAIT_AFTER_SYNC

在after_sync模式下解决了after_commit模式带来的数据不一致的问题,因为主库没有提交事务。但也会有个问题,当主库在binlog flush并且binlog同步到了备库之后,binlog sync之前发生了abort,那么很明显这个事务在主库上是未提交成功的(由于abort之前binlog未sync完成,主库恢复后事务会被回滚掉),但由于从库已经收到了这些Binlog,并且执行成功,相当于在从库上多出了数据,从而可能造成“数据不一致”。

此外,MySQL半同步复制架构中,主库在等待备库ack时候,如果超时会退化为异步后,也可能导致“数据不一致”。

三、备注&解决方案(以上解决思路可以满足99.8%公司的业务场景)

1、通过以上两点的分析和配置,我们发现MySQL自身的Repliaction已经无法满足我们爱钻牛角尖同学的欲望了(后端的程序员思维都会过于缜密),怎么办?为了保证主从的数据绝对一致性,下面我来提供两个思路(今天有点累,仅仅是思路,具体解决方案请听下回分解)。
2、阿里云自己研发的数据订正平台。
3、PXC数据强一致性解决方案并且支持多主多从哦,缺点是需要向老板申请性能差别不大的机器做集群。

 

 



作者:寂寞的棍棍
链接:https://www.jianshu.com/p/328ad87bde5e
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: mysql主从复制可以通过以下几种方式来保持数据一致性: 1. 在主库上开启 binlog,从库上开启 relay log,通过 binlog 和 relay log 来同步数据。 2. 在主库上开启 GTID,从库上也开启 GTID,通过 GTID 来同步数据。 3. 在主库上开启半同步复制,从库上开启半同步复制,通过半同步复制保证数据一致性。 4. 在主库和从库上都开启并行复制,通过并行复制来加快数据同步的速度。 以上几种方式都可以保证数据一致性,具体选择哪种方式需要根据实际情况来决定。 ### 回答2: MySQL主从复制是一种数据同步的机制,数据一致性是保证主库和从库之间数据完全一致的关键要素。 首先,MySQL使用二进制日志(binary log)记录主库上发生的所有操作,并将这些操作传递给从库进行重放。这确保了主库和从库拥有相同的数据集。 其次,MySQL主从复制通过复制事件(replication event)对数据进行同步。在主库上执行的每个数据库操作都被记录为一个事件,并按照顺序传递给从库进行执行。这样,不论是数据的插入、更新还是删除操作,从库都能按照相同的顺序和方式执行,保持数据一致性。 此外,MySQL主从复制采用基于事务的方式进行数据复制。主库上执行的每个事务都会被记录为一个复制事件,并且这些事务在从库上以相同的顺序和方式执行,从而确保数据一致性。 在主从复制中,还存在一个重要的因素是延迟(lag)。由于网络、硬件等原因,从库上执行复制事件可能会有一定的延迟。为了保持数据一致性,需要通过设置参数和监控机制,确保从库上的延迟不会影响主库和从库之间的数据一致性。 同时,为了避免主库的故障导致数据丢失,MySQL提供了半同步复制(semi-synchronous replication)机制。通过将事务在主库上的提交确认同步到至少一个从库后再返回给客户端,确保了主库上的数据改变已经有效地被至少一个从库接收,从而提高了数据一致性和可靠性。 综上所述,MySQL主从复制通过二进制日志记录、复制事件同步、基于事务的复制和延迟监控,以及半同步复制等机制,保证了数据在主库和从库之间的一致性。 ### 回答3: MySQL主从复制是一种常用的数据复制方案,用于同步将一个数据库的变更应用到其他多个数据库上。为了保持数据一致性MySQL主从复制采用了以下几个机制: 1. 二进制日志(Binary Log):主服务器将所有的数据更新操作(如插入、更新、删除等)记录在二进制日志中,并定期将其发送给从服务器。从服务器通过读取主服务器的二进制日志,将这些操作逐一应用到自己的数据库中。这保证了数据的变更在从服务器上按照相同的顺序被执行。 2. GTID(Global Transaction Identifier):GTID是一个全局事务标识符,用于跟踪主服务器上的每个事务操作。主服务器在每个事务的开始和结束时生成一个GTID,并发送给从服务器。从服务器通过比较主服务器和自己的GTID来判断是否已经应用了相应的事务操作,以避免重复应用。 3. 复制线程和日志解析器:MySQL从服务器通过启动一个复制线程(I/O Thread)与主服务器建立连接,并通过日志解析器(SQL Thread)解析并执行主服务器发来的二进制日志。这两个线程协同工作,确保数据的变更被正确地复制到从服务器。 4. 延迟监控和错误检测:MySQL主从复制提供了延迟监控功能,可以检测从服务器与主服务器之间的延迟情况。如果发生网络故障或其他错误,复制过程可能会中断或延迟,MySQL会自动检测并尝试重新连接。同时,还可以通过配置参数来设置复制过程的超时时间,确保数据同步的正常性和一致性。 综上所述,MySQL主从复制通过二进制日志、GTID、复制线程和日志解析器、延迟监控和错误检测等机制来保持数据一致性。这些机制确保了主服务器上的数据变更能够同步地应用到从服务器上,从而达到数据一致性和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值