故障分析 | MySQL 异地从库复制延迟案例一则

最新推荐文章于 2022-11-28 23:47:42 发布

爱可生开源社区

最新推荐文章于 2022-11-28 23:47:42 发布

阅读量472

点赞数

分类专栏：故障分析文章标签：从库延迟 perf pstack

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ActionTech/article/details/123184229

版权

故障分析专栏收录该内容

109 篇文章 8 订阅

订阅专栏

作者：任坤

现居珠海，先后担任专职 Oracle 和 MySQL DBA，现在主要负责 MySQL、mongoDB 和 Redis 维护工作。

本文来源：原创投稿

*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

1、背景

线上某核心 MySQL ，版本为 5.6，本地机房1主2从，同时部署了一个异地从库。

从2月14号起异地从库开始报警复制延迟，一开始以为是网络波动导致就没有处理，但是2天后该报警依然存在且延迟越来越高。

2、诊断

登录该异地从库，首先甄别是不是IO复制线程引发的延迟。

该步骤很简单，查看 show slave status 的 Master_Log_File 是不是主库当前的 binlog ，如果是说明IO复制线程没有延迟，那就是 SQL 复制线程引起的。

获取该 mysqld 的进程 ID ，执行 perf record -ag -p 11029 – sleep 10; perf report

反复执行多次，每次都有 deflate_slow 且占据比例最高

将其展开，和压缩页有关联

pstack 11029 多次抓取现场，也是和压缩页有关。

该实例确实有个大表，并且只有异地从库开启了页压缩，将其行格式转为 dynamic 。

查看 Seconds_Behind_Master，延迟指标开始逐步下降，说明该方案生效了。

再次抓取 perf 和 pstack 现场。

–perf report

–pstack

可以看到和页压缩相关的 API 已经消失，再次确认了本次复制延迟和大表开启页压缩有直接关系。

3、小结

借助 perf 和 pstack 工具，能很快定位是压缩表引发的 SQL 线程复制延迟，将大表解压缩后最终解决该问题。

爱可生开源社区

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。