DM7主备集群分裂问题:
(以下为个人遇到问题的记录)
1、问题描述:
4节点主备数据库,查看主库运行日志报错:本地实例和远程实例发生分裂,需要用户干预 。
2、现场情况:
通过确认监视器日志查看到:此时有两个主库,原主库为MOUNT状态,自当切换的主库为OPEN状态,说明监视器认为主库有故障,自动切换备库为主库,通过监视器的日志看到,监视器多次与4台数据库进行重连,连接不上,确认为数据库故障,就多次切换备库为主库,导致守护组件损坏。
3、检查结果:
4节点数据库之间通讯没有问题,但和确认监视器的通讯不稳定,导致确认监视器频繁切换主库。
4、处理方法:
关闭确认监视器,关闭守护进程,把状态为open的数据库中的watcher.ctl文件,分别替换到为mount状态的数据库,重新启动守护,拉起服务,此时4节点数据库均为open状态,前台启动确认监视器手动把主库切换回来,由于确认监视器与数据库通讯不稳定,暂时关闭确认监视器。