tidb版本5.3.1
故障现象:
今天客户搭建binlog做同步的时候,发现有延时同步一会就卡主,重启下drainer又重新开始同步。
pump日志如下,日志中有报错pump is paused
show pump status提示如下,看到state有个pump是paused,这个集群只有1个pump,这个paused是之前缩容没有清理干净导致的
执行下面命令将之前缩容的pump清理后同步恢复正常,故障原因就是drainer读到了之前已经缩容掉的pump的数据所以卡死
bin/binlogctl -pd-urls=http://127.0.0.1:2379 -cmd update-pump -node-id ip-127-0-0-1:8250 -state offline