故障表现
哨兵只存在两个的时候,当哨兵模式的redis主节点挂掉以后,业务组件不能切换到新主节点
故障原因
redis哨兵依旧认为旧主为主节点,没有触发failover
故障原因定位
哨兵集群部署方式:
1主1从,3哨兵
哨兵初始配置项:
这里主要关注sentinel monitor投票数为2
代表必须有两个哨兵都认为主节点不在线了,即两个主节点认为主观下线(即sdown)才会触发客观下线(即odown)
解决过程
1.后台指定日志文件启动哨兵 /usr/bin/redis-sentinel /etc/redis-sentinel.conf > /data/thirdAssembly/redis/log/17000/17000.log>&1 & ,查看日志
2.发现日志显示不能正确判断139机器的哨兵状态
telnet 139的哨兵端口,发现报错信息