读mysql45讲-主备延迟

最新推荐文章于 2024-02-04 22:33:21 发布

西埃斯迪恩-霖

最新推荐文章于 2024-02-04 22:33:21 发布

阅读量626

点赞数

分类专栏：待删除文章标签： mysql sql 数据库

本文链接：https://blog.csdn.net/ZRL1996/article/details/123619531

版权

82 篇文章 0 订阅

订阅专栏

正常在主库中执行完的事务会被写入到binlog中，然后通过线程发送给备库，备库解析出binlog日志再执行，来保证数据的一致性，其中与数据同步的有关的时间点有三个：

所谓的主备延迟就是同一个事务，在备库执行完成的时间和在主库中执行完的时间的差值，也就是上面的T3-T1。

在备库上执行show slave statue命令，会显示seconds_behind_master,用于显示当前备库延迟了多少秒。

seconds_behind_master的计算方式如下：

如果主库和备库的系统时间不一样，备库在连接到主库的时候，会通过SELECTUNIX_TIMESTAMP()函数来获取当前时间主库上的时间，如果主库的时间和备库的时间不一致，在计算seconds_behind_master的时候会扣掉这个差值。

主备延迟的最主要来源是备库接收到binlog和执行完binlog记录的事务之间的时间差，也就是T3-T2，最直接的表现就是备库消费中专日志（relay log）的速度比不上主库发送到备库的binlog的速度。

通常情况下会将一些查询语句分配到备库上执行，如果对备库的查询没有做控制，会导致对备库的查询压力很大，耗费CPU资源，从而会影响到同步速度，导致了主备延迟。
这种情况可以通过一主多从的方式，也就是除了备库之外，多连接几个从库，分担压力。

因为主库将binlog传输给备库的前提是主库需要写完事务，如果一个事务在主库上写完需要10分钟，那从主库写入到备库写入肯定就是超过10分钟的。

常见的业务背景是，一些归档类的数据，平时没有删除数，一直到了空间不够用的时候才来删除旧数据。这个时候如果用delete来一次性的删除大量数据就会很慢。

还有就是大表的DDL也会出现这个情况。

因为主备延迟的存在，所以在主备切换的时候就会有不同的策略。

在双M的结构下，进行主备切换的过程大致如下：

在这一系列的步骤中，是有一段时间中数据库是不可用状态的。在步骤2和步骤5之间，数据库都是只读状态的。

在这个不可用状态中，比较耗费时间的是步骤3，可能需要耗费好几秒的时间。这也是为什么需要在步骤1先做判断，确保seconds_behind_master的值足够小。

试想如果一开始主备延迟就长达30分钟，而不先做判断直接切换的话，系统的不可用时间就会长达30分钟，这种情况一般业务都是不可接受的。

如果强行把步骤4和步骤5调整到最开始执行，也就是说不等数据同步之后就直接让业务端操作备库B，那基本上就没有数据库不可用时间了。但是这个操作可能会出现数据不一致的情况。

使用可用性策略，并且binlog_format=mixed，假设现在的主备延迟是5s：

主库A执行完一个事务并且写完binlog，这个时候新开启了一个事务insert(4,4)，之后进行主备切换。
因为主备延迟5s的影响，所以备库B还没消费insert(4,4)这个中转日志的时候，备库B已经切换为主库，可以进行读写，如果这个时候需要插入insert(5,5)。
备库B插入之后，将操作insert(5,5)对应的binlog也发给主库A。
insert语句都假设是不带主键的，主键自增的。那备库B将主库发过来的insert(4,4)执行完，主库A执行备库发过来的insert(5,5)；两行数据在两个数据库中的主键都是不一样的，就出现了数据不一致的情况。

如果使用可用性优先策略，并且binlog_format=row会出现这个情况么？