MySQL高级之主从复制
一、主从复制基础知识
1. 引入主从复制
- 一般应用对数据库而言都是“ 读多写少 ”,也就说对数据库读取数据的压力比较大,因此,我们可以采用数据库集群的方案,做主从架构、进行读写分离 ,这样可以提升数据库的并发处理能力。
注意:主库其实也可以进行读取,但我们一般只对其执行写操作,不进行读取,即默认不读取主库。
2. 主从复制的作用
- 读写分离
我们可以通过主从复制的方式来同步数据,然后通过读写分离提高数据库并发处理数据的能力。其中一个是Master主库,负责写入数据,我们称之为写库。其它都是Slave从库,负责读取数据,我们称之为读库。当主库进行更新的时候,会自动将数据复制到从库中,而我们在客户端读取数据的时候,会从从库中进行读取。 - 数据备份
我们通过主从复制将主库上的数据复制到了从库上,相当于是一种热备份机制,也就是在主库正常运行的情况下进行的备份,不会影响到服务。 - 高可用性
数据备份实际上是一种冗余的机制, 通过这种冗余的方式可以换取数据库的高可用性,也就是当服务器出现故障或宕机的情况下,可以切换到从服务器上,保证服务的正常运行。
二、主从复制原理
一句话描述:Slave会从Master读取binlog来进行数据同步。
1. 三个线程
- 二进制日志转储线程:即Binlog dump thread,这是一个主库线程。当从库线程连接的时候, 主库可以将二进制日志发送给从库,当主库读取事件(Event)的时候(将二进制文件发送给从库),会在Binlog上加锁,不允许在进行二进制文件的书写操作,读取完成之后,再将锁释放掉。
- 从库I/O线程:该线程会连接到主库,向主库发送请求更新Binlog。这时从库的I/O线程就可以读取到主库的二进制日志转储线程发送的Binlog更新部分,并且拷贝到本地的中继日志(Relay log)。
- 从库SQL线程:该线程会读取从库中的中继日志,并且执行日志中的事件,将从库中的数据与主库保持同步。
2. 复制三步骤
- 步骤1:Master将写操作记录到二进制日志(binlog)。
- 步骤2:Slave将Master的binary log events拷贝到它的中继日志(relay log);
- 步骤3:Slave重做中继日志中的事件,将改变应用到自己的数据库中。MySQL复制是异步的且串行化的,而且重启后从接入点开始复制。
3. 复制基本原则
- 每个Master和Slave只能有一个唯一的服务器ID。
- 每个Slave只能有一个Master。
- 每个Master可以有多个Slave。
4. 主从同步的要求
- 读库和写库的数据一致(最终一致)。
- 写数据必须写到写库。
- 读数据必须到读库。
三、一主一从的搭建
四、主从复制的延时问题
1. 基本概念
- 进行主从同步的内容是二进制日志,它是一个文件,在进行网络传输的过程中就一定会存在主从延迟(比如500ms),这样就可能造成用户在从库上读取的数据不是最新的数据,也就是主从同步中的数据不一致性问题。
- 在网络正常的时候,日志从主库传给从库所需的时间是很短的。即网络正常情况下,主备延迟的主要来源是备库接收完binlog和执行完这个事务之间的时间差。主备延迟最直接的表现是,从库消费中继日志(relay log)的速度,比主库生产binlog的速度要慢。
2. 解决方式
读写分离情况下,解决主从同步中数据不一致的问题, 就是解决主从之间数据复制方式的问题,如果按照数据一致性从弱到强来进行划分,有以下3种复制方式。
2.1 异步复制
异步模式就是客户端提交COMMIT之后不需要等从库返回任何结果,而是直接将结果返回给客户端,这样做的好处是不会影响主库写的效率,但可能会存在主库宕机,而Binlog还没有同步到从库的情况,也就是此时的主库和从库数据不一致。这时候从从库中选择一个作为新主, 那么新主则可能缺少原来主服务器中已提交的事务。所以,这种复制模式下的数据一致性是最弱的。
2.2 半同步复制
MySQL5.5版本之后开始支持半同步复制的方式。原理是在客户端提交COMMIT之后不直接将结果返回给客户端,而是等待至少有一个从库接收到了Binlog,并且写入到中继日志中,再返回给客户端。这样做的好处就是提高了数据的一致性,当然相比于异步复制来说,至少多增加了一个网络连接的延迟,降低了主库写的效率。
在MySQL5.7版本中还增加了一个rpl_semi_sync_ master_wait_for_slave_count
参数,可以对应答的从库数量进行设置,默认为1,也就是说只要有1个从库进行了响应,就可以返回给客户端。如果将这个参数调大,可以提升数据一致性的强度,但也会增加主库等待从库响应的时间。
2.3 组复制
异步复制和半同步复制都无法最终保证数据的一致性问题,半同步复制是通过判断从库响应的个数来决定是否返回给客户端,虽然数据一致性相比于异步复制有提升,但仍然无法满足对数据一致性要求高的场景,比如金融领域。MGR很好地弥补了这两种复制模式的不足。
组复制技术,简称MGR(MySQL Group Replication),它是MySQL在 5.7.17版本中推出的一种新的数据复制技术,这种复制技术是基于Paxos协议的状态机复制。
首先将多个节点共同组成一个复制组,在执行读写(RW)事务的时候,需要通过一致性协议层(Consensus 层)的同意,也就是读写事务想要进行提交,必须要经过组里“大多数人”(对应Node节点)的同意,大多数指的是同意的节点数量需要大于(N/2+1),这样才可以进行提交,而不是原发起方一个说了算。而针对只读(RO)事务则不需要经过组内同意,直接COMMIT即可。在一个复制组内有多个节点组成,它们各自维护了自己的数据副本,并且在一致性协议层实现了原子消息和全局有序消息,从而保证组内数据的一致性。