MySQL主备、主从、读写分离

最新推荐文章于 2024-07-11 15:47:11 发布

小楼星辰

最新推荐文章于 2024-07-11 15:47:11 发布

阅读量612

点赞数 1

分类专栏： Java

本文链接：https://blog.csdn.net/qq_36789243/article/details/119395638

版权

本文详细探讨了MySQL主备复制的基本原理、循环复制问题、主备延迟及其解决办法，主备切换策略（可靠性优先与可用性优先），并行复制策略，以及在主库出现问题时的应对措施。此外，还介绍了MySQL读写分离的架构和解决方案，包括强制走主库、Sleep方案和判断主备无延迟方案等，以实现高效、稳定的数据库架构。

摘要由CSDN通过智能技术生成

一、MySQL主备的基本原理

在这里插入图片描述
在状态1中，客户端的读写都直接访问节点A，而节点B是A的备库，只是将A的更新都同步过来，到本地执行。这样可以保持节点B和A的数据是相同的。当需要切换的时候，就切成状态2。这时候客户端读写访问的都是节点B，而节点A是B的备库

在状态1中，虽然节点B没有被直接访问，但是建议把备库节点B，设置成只读模式。有以下几个原因：

有时候一些运营类的查询语句会被放到备库上去查，设置为只读可以防止误操作
防止切换逻辑有bug
可以用readonly状态，来判断节点的角色
把备库设置成只读，还怎么跟主库保持同步更新？

readonly设置对超级权限用户是无效的，而用于同步更新的线程，就拥有超级权限

下图是一个update语句在节点A执行，然后同步到节点B的完整流程图：
在这里插入图片描述
备库B和主库A之间维持了一个长连接。主库A内部有一个线程，专门用于服务备库B的这个长连接。一个事务日志同步的完整过程如下：

在备库B上通过change master命令，设置主库A的IP、端口、用户名、密码，以及要从哪个位置开始请求binlog，这个位置包含文件名和日志偏移量
在备库B上执行start slave命令，这时备库会启动两个线程，就是图中的io_thread和sql_thread。其中io_thread负责与主库建立连接
主库A校验完用户名、密码后，开始按照备库B传过来的位置，从本地读取binlog，发给B
备库B拿到binlog后，写到本地文件，称为中转日志
sql_thread读取中转日志，解析出日志里的命令，并执行

由于多线程复制方案的引入，sql_thread演化成了多个线程

二、循环复制问题

双M结构：
在这里插入图片描述
节点A和节点B互为主备关系。这样在切换的时候就不用再修改主备关系

双M结构有一个问题要解决，业务逻辑在节点A上更新了一条语句，然后再把生成的binlog发给节点B，节点B执行完这条更新语句后也会生成binlog。那么，如果节点A同时是节点B的备库，相当于又把节点B新生成的binlog拿过来执行了一次，然后节点A和B间，会不断地循环执行这个更新语句，也就是循环复制

MySQL在binlog中记录了这个命令第一次执行时所在实例的server id。因此，可以用下面的逻辑，来解决两个节点间的循环复制问题：

规定两个库的server id必须不同，如果相同，则它们之间不能设定为主备关系
一个备库接到binlog并在重放的过程中，生成与原binlog的server id相同的新的binlog
每个库在收到从自己的主库发过来的日志后，先判断server id，如果跟自己的相同，表示这个日志是自己生成的，就直接丢弃这个日志

双M结构日志的执行流如下：

从节点A更新的事务，binlog里面记的都是A的server id
传到节点B执行一次以后，节点B生成的binlog的server id也是A的server id
再传回给节点A，A判断这个server id与自己的相同，就不会再处理这个日志。所以，死循环在这里就断掉了

三、主备延迟

在这里插入图片描述

1、什么是主备延迟？

与数据同步有关的时间点主要包括以下三个：

主库A执行完成一个事务，写入binlog，这个时刻记为T1
之后传给备库B，备库B接收完这个binlog的时刻记为T2
备库B执行完这个事务，把这个时刻记为T3

所谓主备延迟，就是同一个事务，在备库执行完成的时间和主库执行完成的时间之间的差值，也就是T3-T1

可以在备库上执行show slave status命令，它的返回结果里面会显示seconds_behind_master，用于表示当前备库延迟了多少秒

seconds_behind_master的计算方法是这样的：

每个事务的binlog里面都有一个时间字段，用于记录主库上写入的时间
备库取出当前正在执行的事务的时间字段的值，计算它与当前系统时间的差值，得到seconds_behind_master

如果主备库机器的系统时间设置不一致，不会导致主备延迟的值不准。备库连接到主库的时候，会通过SELECTUNIX_TIMESTAMP()函数来获得当前主库的系统时间。如果这时候发现主库的系统时间与自己不一致，备库在执行seconds_behind_master计算的时候会自动扣掉这个差值

网络正常情况下，主备延迟的主要来源是备库接收完binlog和执行完这个事务之间的时间差

主备延迟最直接的表现是，备库消费中转日志的速度，比主库生产binlog的速度要慢

2、主备延迟的原来

1.有些部署条件下，备库所在机器的性能要比主库所在的机器性能差

2.备库的压力大。主库提供写能力，备库提供一些读能力。忽略了备库的压力控制，导致备库上的查询耗费了大量的CPU资源，影响了同步速度，造成主备延迟

可以做以下处理：

一主多从。除了备库外，可以多接几个从库，让这些从库来分担读的压力
通过binlog输出到外部系统，比如Hadoop这类系统，让外部系统提供统计类查询的能力

3.大事务。因为主库上必须等事务执行完才会写入binlog，再传给备库。所以，如果一个主库上的语句执行10分钟，那这个事务很可能会导致从库延迟10分钟

典型的大事务场景：一次性地用delete语句删除太多数据和大表的DDL

四、主备切换策略

1、可靠性优先策略

双M结构下，从状态1到状态2切换的详细过程如下：

判断备库B现在的seconds_behind_master，如果小于某个值继续下一步，否则持续重试这一步

把主库A改成只读状态，即把readonly设置为true
判断备库B的seconds_behind_master的值，直到这个值变成0为止
把备库B改成可读写状态，也就是把readonly设置为false
把业务请求切到备库B

在这里插入图片描述
这个切换流程中是有不可用的时间的。在步骤2之后，主库A和备库B都处于readonly状态，也就是说这时系统处于不可写状态，直到步骤5完成后才能恢复。在这个不可用状态中，比较耗时的是步骤3，可能需要耗费好几秒的时间。也是为什么需要在步骤1先做判断，确保seconds_behind_master的值足够小