关键字:
KingbaseES、 集群、流复制、人大金仓
前情提要:
如上图所示为一般情况下集群的正常表现,(红框中为需要关注点)然而在进行主备切换、备机手动升主、还原操作等,会导致红框中的集群运行状态、流复制、时间线等出现异常情况,对于不同的异常情况需要进行修复,现列举如下。
场景分类:
主库时间线领先,流复制丢失
此时,先关闭集群:
./sys_monitor.sh stop
启动主机数据库:
./sys_ctl -D ~/cluster/project0918/test2/kingbase/data start
在备机执行重做备机操作:
./repmgr -h 10.10.9.15 -U esrep -d esrep -p 51111 standby clone -F
启动备机的数据库:
sys_ctl -D /home/xieyp/cluster/project0918/test2/kingbase/data start
注册备机:
./repmgr standby register –force
2.2 备库时间线领先,流复制丢失,双主(备节点被promote后成为主角色(双主) 时间线+1 领先于主)
此时,先标记备节点为standby
恢复,抹平时间:
2.3 备机运行为主机,主机为?unreachable,时间线丢失
此时,集群处于关闭状态,将备机数据库打开。
备节点执行提升备节点为主节点操作:
./repmgr standby promote
打开原主机的数据库,并将备节点注册为主机:
./repmgr primary register –F
关闭原主机的数据库,然后执行重做备机操作:
./repmgr -h 新主机ip -U esrep -d esrep -p 51111 standby clone –F
重做完成后,启动数据库:
sys_ctl –D 目录 start
执行注册备机到集群操作:
./repmgr standby register –force
源主机手动启动kbha:
./kbha -A daemon -f ../etc/repmgr.conf
查看集群状态:
./repmgr cluster show