#在备库上执行,从主库克隆数据目录到备库
repmgr standby clone -h ${主库IP} -d esrep -U esrep -p ${主库port} [--force] [--fast-checkpoint]
参数说明:
--force,如果本地存在数据目录且目录非空,使用此参数将覆盖该目录,否则将报错退出;
此命令调用sys_basebackup从主库克隆数据目录在备库,一般只在集群部署阶段、集群扩容节点阶段使用。如果是运维过程处理问题,一般用于 重建备库 ——某些故障数据库无法使用node rejoin恢复时,需要重建备库。
--fast-checkpoint,在主库上执行快速检查点。
未指定此参数,克隆动作会在主库上执行一个普通检查点,如果主库上一次检查点完成不久,本次普通检查点刷新脏页到磁盘时会主动延迟,整个执行耗费时间会比快速检查点要更长。快速检查点则能够以最快速度完成。
1.在主库查看集群现状(可以看到 node103 节点是异常,需要重新加入)
2.运行 repmgr node rejoin报错(这是由于 node103 的 timeline 比 primary 要大,不能 rewind)
3. 在主库执行命令repmgr service pause暂停集群自动恢复功能
4.在备库删除 $data_directory(repmgr.conf中的参数)目录下的所有文件,运行 repmgr standby clone
5.在备库启动 node103 数据库,执行repmgr standby register -F注册为备库
6.执行命令repmgr service unpause取消暂停
7.确认集群状态