Redis 脑裂问题:
在 Redis 哨兵模式或集群模式中,由于网络原因,导致主节点(Master)与哨兵(Sentinel)和从节点(Slave)的通讯中断,此时哨兵就会误以为主节点已宕机,就会在从节点中选举出一个新的主节点,此时 Redis 的集群中就出现了两个主节点的问题,从而导致数据丢失。
Redis脑裂问题复现步骤:
一:主节点(Master)出现网络问题
二:哨兵(Sentinel)发现主节点出现问题,会将一个正常的从节点(Slave)设置成为新的主节点(Master)
三:旧客户端会给旧的主节点(Master)写入新的数据
四:旧的主节点(Master)重新加入集群
五:旧主节点(Master)变为从节点(Slave) 数据丢失问题出现
详解步骤五(具体执行流程):
- Slave(旧 Master)会向 Master(新)申请全量数据
- Master 会通过 bgsave 的方式生成当前 RDB 快照,并将 RDB 发送给 Slave
- Slave 拿到 RDB 之后,先进行 flush 清空当前数据 (步骤三:旧客户端发送的数据就丢失)
- 再加载 RDB 数据,初始化自己当前的数据
如何解决Redis脑裂问题:
需要在旧 Master 恢复网络之后,切换身份为 Slave 期间,拒接客户端的数据写入
Redis提供了相关配置:
min-slaves-to-write:与主节点通信的从节点数量必须大于等于该值主节点,否则主节点拒绝写入
min-slaves-max-lag:主节点与从节点通信的 ACK 消息延迟必须小于该值,否则主节点拒绝写入
以上两个必须同时满足,否则主节点拒绝写入