1 哨兵的作用
哨兵是redis集群架构中非常重要的一个组件,主要功能如下:
1. 集群监控:负责监控redis master和slave进程是否正常工作
2. 消息通知:如果某个redis实例有故障,那么哨兵负责发送消息作为报警通知给管理员
3. 故障转移:如果master node挂掉了,会自动转移到slave node上
4. 配置中心:如果故障转移发生了,通知client客户端新的master地址
2 哨兵的核心知识
- 故障转移时,判断一个master node是宕机了,需要大部分的哨兵都同意才行,涉及到了分布式选举的问题
- 哨兵至少需要3个实例,来保证自己的健壮性
- 哨兵 + redis主从的部署架构,是不会保证数据零丢失的,只能保证redis集群的高可用性
3 sdown和odown
- sdown和odown两种失败状态
- sdown是主观宕机,就一个哨兵如果自己觉得一个master宕机了,那么就是主观宕机
- odown是客观宕机,如果quorum数量的哨兵都觉得一个master宕机了,那么就是客观宕机
- sdown达成的条件:如果一个哨兵ping一个master,超过了is-master-down-after-milliseconds指定的毫秒数之后,就主观认为master宕机
- odown达成的条件:如果一个哨兵在指定时间内,