已按照官方手册搭建两节点主备实时同步集群,故障非自动切换
192.168.255.101 主 实例GRP1_RT_01
192.168.255.102 备 实例GRP1_RT_02
在主库机器前台启动监视器, 初始的主备状态正常
同样在备库机器前台启动监视器, 初始的主备状态正常
生产环境业务都是连在主库操作,主库出问题影响还是很大的
制造主库的一些故障,看会发生什么?
1.主库掉电(关闭主库所在虚拟机模拟)
执行关闭,监视器提示:接收守护进程(GRP1_RT_01)消息超时,守护的状态为ERROR,其他状态没变化
执行show,查看集群状态,主库已经故障,主库守护的状态为ERROR
执行tip,查看集群状态
主库上电(打开主库所在虚拟机模拟),等待一会后,监视器日志刷新,主库守护状态从NONE到OPEN
实例状态从MOUNT到OPEN
再次tip查看集群状态
结论:故障非自动切换模式下,主机掉电后,重新恢复供电,集群状态会恢复原始的正常主备状态
2.主库断网(命令关闭网络)
关闭网络后,监视器日志刷新:接收守护进程(GRP1_RT_01)消息超时,这与主库断电后显示基本一致
通过show查看,主库守护状态ERROR,与主库断电效果一样
在vmvare软件里,恢复网络
监视器自动刷新,主库守护进程从NONE到OPEN, 此处与主库断电供电的情形不同
tip查看集群状态,状态正常
结论:故障非自动切换模式下,主机切断网后,过一段时间恢复网络,集群状态会恢复原始的正常主备状态
在主库机器,前台启动监视器
3.备库掉电(关闭备库所在虚拟机模拟)
执行关闭,监视器提示:接收守护进程(GRP1_RT_02)消息超时,守护状态ERROR
主库实例的守护进程发生状态切换,OPEN–>FAILOVER–>OPEN
查看集群备库状态,除守护状态INVALID外;RSTAT也为INVALID, 此字段对备库有效 ,表示主库到备库的归档状态为无效
此时主库导入一些数据,猜想正常情况下,备库故障,并不影响主库写入
备库恢复供电,监视器日志刷新,主库,备库的守护进程都发生切换变化
查看集群状态,集群状态正常
备库登录disql确认数据, 数据从主同步到了备
结论:故障非自动切换模式下,备机掉电后,重新恢复供电,集群状态会恢复原始的正常主备状态
4.备库断网(命令关闭网络)
关闭网络后,监视器日志刷新:备实例守护进程ERROR,主实例守护切换,依旧回到OPEN
通过show查看,备库异常,与断电情况相似
在vmvare软件里,恢复网络
监视器自动刷新,备实例守护进程open,主实例守护进程有切换
tip查看集群状态,状态正常
结论:故障非自动切换模式下,备机切断网后,过一段时间恢复网络,集群状态会恢复原始的正常主备状态
结论汇总:无论是主备机任一简单的掉电,断网(一个正常,另外一个不正常),在恢复供电,网络后,集群会恢复到原始的正常主备状态。
更多资讯请上达梦技术社区了解:https://eco.dameng.com