哨兵模式--哨兵节点的功能?

哨兵节点的主要功能有:

  1. 集群监控:监控 主、从节点的健康状况;
  2. 自动切换主节点:当 Master 运行故障,哨兵启动自动故障恢复流程:从 slave 中选择一台作为新 master。
  3. 通知:让 slave 执行 replicaof,与新的 master 同步;并且通知客户端与新 master 建立连接。

集群监控

哨兵(Sentinel)会给 主、从节点 发送PING 命令:

  • 对于 主节点:如果当前哨兵 发送给主节点的PING命令,但主节点并未回复,就会被当前哨兵视为主观下线。如果哨兵集群中的多数哨兵(一般是超过一半)都认为主节点是 主观下线,则 主节点 会被视为客观下线
  • 对于 从节点:如果当前哨兵 发送给主节点的PING命令,但主节点并未回复,就会被当前哨兵视为主观下线

自动切换主节点(故障转移)

在集群监控中,如果 主节点 被视为 客观下线。就会触发 自动切换主节点。选举新的主节点 的条件是(按照如下顺序进行筛选):

  1. 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
  2. slave 优先级:每一个节点都会在配置文件中有一个优先级设置(slave-prority),优先级高的从节点 胜出;
  3. 比较 slave 与旧 master 复制进度的差距 offsetoffset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、
  4. runIDrunID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。

通知

选举完新主节点之后,还需要:

  1. 哨兵 将 新主节点的信息,发送给其他 从节点,让 slave 执行 replacaof 命令,和新「master 节点」建立连接,并进行数据复制;
  2. 哨兵 还需要将 新主节点信息 通知到所有的客户端,让客户端将读、写请求转移到 新的 master 节点。

补充

如何建立 哨兵 与 master节点、slave节点的通信?

  1. 配置哨兵节点的配置文件:首先,需要配置哨兵的配置文件(通常为sentinel.conf),指定主节点的IP地址、端口以及主节点的名称。
  2. 向master节点发送INFO指令:Sentinel启动后根据配置向Master发送 INFO 指令,获取并保存所有哨兵(Sentinel)状态,主节点(Master)和从节点(Slave)信息。此时,就建立了 哨兵 与 master节点、slave节点的通信信息了。

如何建立 哨兵 与 哨兵 之间的通信?

哨兵之间可以相互通信,主要归功于 Redis 的 pub/sub (发布/订阅)机制。具体步骤:

  1. 哨兵 与 master 节点 建立通信;
  2. 然后,就可以利用 Master 提供的发布/订阅机制,通过订阅Master的__sentinel__:hello频道,当自身节点启动或更新其状态时,重新发布自己的当前状态和信息(Name、IP、Port消息),同时订阅其他哨兵发布的Name、IP、Port消息。
  • 互相发现之后建立起了连接,后续的消息通信就可以直接进行交互

image

主从动态切换(故障转移)的具体流程

参考:详解Redis哨兵模式下,主节点掉线而重新选取主节点的流程 -阿里云开发者社区 (aliyun.com)

主要分为两部分:

  1. 哨兵集群中,选出一个节点作为leader;
  2. 由哨兵leader负责挑选出新的master节点;

哨兵集群选择leader

步骤:

  1. 哨兵集群中的每一个哨兵都会发起一个“拉票请求”。
  2. 收到这个拉票请求的 哨兵节点会 回复一个“投票响应”,有两种结果:投、不投;
  3. 一轮投票完成之后,得票数超过半数的哨兵节点将成为leader;
  4. 如果出现平票的情况,则重新再投一次票。【这也是建议哨兵节点数量设置为 奇数的原因:不容易产生平票的情况。】

img

注意:这里的投票逻辑是:Raft 算法的核心是 “先下手为强”,谁率先发出了拉票请求,谁就有更大的概率成为 leader。

img

哨兵leader挑选出新master节点

前 步是检测 当前主节点是否客观下线的。

  1. 检测当前主节点是否 主观下线:哨兵会定期向主节点和从节点发送PING命令进行心跳检测,以确保这些节点正常运行。如果哨兵在指定的时间内没有收到主节点或从节点的回复,它就会认为该节点主观下线(SDOWN)。

    具体:发送的内容:publish sentinel :hello,如果超时不响应则标记 主观下线(sdown)。超时时间配置 down-after-milliseconds

  2. 检测当前主节点是否 客观下线:当一个哨兵认为主节点主观下线后,它会询问其他哨兵节点,以确定这是否是一个共识。如果足够多的哨兵(一般为超过半数)认为主节点不可达,那么主节点将被标记为客观下线(ODOWN),并开始故障转移流程。

    询问其他哨兵节点时,发送的指令sentinel is-master-down-by-address-port

  3. 哨兵集群选择leader:当确定需要故障转移时,会先选举出一个 哨兵leader,来负责后续的新master节点选举的工作。

  4. 哨兵leader开始选举 新master节点:筛选条件依次如下

    1. 健康状况:那些经常被标记为 主观下线的从节点,会被视为不健康,会被过滤掉;
    2. slave 优先级:每一个节点都会在配置文件中有一个优先级设置(slave-prority),优先级高的从节点 胜出;
    3. 比较 slave 与旧 master 复制进度的差距 offsetoffset值越大,表示从节点和主节点的数据越接近。(如 slave2 的 offset 为90, slave1 偏移量 为100。那么哨兵就会认为slave2的网络不佳,优先选择slave1为新的主节点)、
    4. runIDrunID是每个redis节点启动时随机生成的(按照其字典序比较大小),ID 号最小的从库得分最高,会被选为新主节点。
  5. 信息通知:当选举出新master节点后,哨兵leader会将 ①新主节点 发送给 从节点;②将新主节点信息发送给客户端。

参考

Redis 高可用篇:你管这叫 Sentinel 哨兵集群原理 - Redis - SegmentFault 思否

高可用之战:Redis Sentinal(哨兵模式) - Hello-Brand - 博客园 (cnblogs.com)

redis哨兵模式的原理及部署 - misakivv - 博客园 (cnblogs.com)

  • 22
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值