Redis哨兵机制详解

TwosJel

已于 2023-05-04 10:59:33 修改

阅读量245

点赞数

分类专栏： Redis 文章标签： redis 缓存 java 面试 nosql数据库

于 2023-02-20 22:16:26 首次发布

本文链接：https://blog.csdn.net/weixin_64366370/article/details/129132169

版权

Redis 专栏收录该内容

6 篇文章

订阅专栏

文章介绍了Redis主从架构中，当master节点宕机时，哨兵(Sentinel)如何进行监控、客观下线判断、故障恢复（包括slave选为新master的条件）以及数据同步的过程。哨兵通过心跳机制检测实例状态，实现自动故障恢复和通知功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Redis主从架构中，当slave节点意外宕机后，可以通过全量同步或者增量同步来进行数据的恢复和同步。（这里不了解这个的朋友可以去看看我主页关于Redis主从数据同步原理的详解：传送门！快点我！）

但是大家有没有想过，如果Redis主从集群中，master宕机了呢！那应该怎么办呢？是不是就没人给它数据同步，导致整个业务挂掉了呢？因此我们本文介绍了Redis对于master节点宕机的解决方法：哨兵机制。

哨兵（Sentinel）的结构如图：

首先我们先要知道哨兵有啥作用，哨兵的作用如下：

监控：Sentinel 会不断检查您的master和slave是否按预期工作

自动故障恢复：如果master故障，Sentinel会将一个slave提升为master。当故障实例恢复后也以新的master为主

通知：Sentinel充当Redis客户端的服务发现来源，当集群发生故障转移时，会将最新信息推送给Redis的客户端

哨兵监控Redis主从集群原理

从上图我们可以看到，我们搭建了几个Sentinel（哨兵）集群来监控我们的Redis主从集群的健康状态，那么它们是如何监控的呢？

在详细介绍原理之前，我们需要了解两个概念：①主观下线 ②客观下线：

•主观下线：如果某sentinel节点发现某实例未在规定时间响应，则认为该实例主观下线。

•客观下线：若超过指定数量（quorum）的sentinel都认为该实例主观下线，则该实例客观下线。quorum值最好超过Sentinel实例数量的一半。

Sentinel基于心跳机制监测服务状态，每隔1秒向集群的每个实例发送ping命令。（这里很像Eureka）。每个Sentinel向集群中的节点发送Ping，如果在规定的时间内，节点没有返回Pong的命令给Sentinel，则该Sentinel会判定该节点为“主观下线”。当判定该节点主观下线的Sentinel数量超过我们设置的“quorum”值时，则该节点“客观下线”。