一、主备库所在的服务器时间不一致会对集群有如下影响:
1、影响mal链接,影响数据同步。
2、影响数据库服务监控,误判进行故障切换。
3、影响dmwatcher服务监控,误判故障切换。
4、影响dmmonitor监控,误判集群状态,可能导致集群异常,无法对外提供服务,需要人工介入恢复。
二、集群里故障检测哪一块内容会用到时间?
1)DM通过MAL系统实现Redo日志传输,以及其他一些实例间的消息通讯。MAL系统检测到链路断开的时间由dmmal.ini 中配置的 MAL_CHECK_INTERVAL 以及MAL_CONN_FAIL_INTERVAL决定,因此不建议在数据守护系统运行过程中调整操作系统时间,避免误判MAL链路断开,影响数据同步。
2)守护进程采用超时机制判断实例是否故障,即当前时间和上次收到消息的时 间差是否超过故障认定时间(INST_ERROR_TIME),因此不建议在数据守护 系统运行过程中调整操作系统时间,避免导致这个差值很大,误判实例故障。
3)守护进程采用超时机制判断远程守护进程是否故障,即当前时间和上次收到消息的时间差是否超过故障认定时间(DW_ERROR_TIME),因此不建议在数据守护系统运行过程中调整操作系统时间,避免导致这个差值很大,误判远程守护进程故障。
4)监视器和守护进程之间也是采用超时机制判断对方是否故障,即当前时间和 上次收到消息的时间差是否超过故障认定时间(守护进程配置的 DW_ERROR_TIME),因此不建议在数据守护系统运行过程中调整操作系统时间,避免导致这个差值很大,误判监视器故障。
三、 误判的结果,一是切换,二是集群瘫痪,这些可能情况的影响因素是什么,比如是主备时间差多大会出现上述结果?