腾讯三面:哨兵挂了,Redis 还能正常工作吗?

本文详细解释了哨兵在Redis主从架构中如何监控节点状态、筛选候选Master,通过优先级、同步进度和ID进行打分选举,以及如何通知其他从库和客户端。重点介绍了哨兵的投票机制和成为Leader的条件。
摘要由CSDN通过智能技术生成

哨兵在进行打分之前,先会在从库进行筛选,把不合格的从库筛选掉,留下优秀的种子选手来进行参赛打分。

那么筛选的依据是什么呢?

哨兵会把标记为下线的从库和主从之间网络不顺畅的从库筛选掉,看下图你就明白了:

在主从模式下,如果主从之间网络断开的次数和超时时间超过 down-after-milliseconds 的设置,那么就会认为该从库网络不健康了,不稳定了。

接下来就会从剩下的优秀从库内进行打分,打分最高者为新的 Master,

打分会从三个层级进行打分,记住只会比较一个层级的分数,只要在当前的层级分数最高就可以了,如果分数相同,再比下一个层级,以此类推。

第一轮:比较从库的优先级

============

你可以手动设置从库的优先级,通过 slave-priority 进行设置,数字越小,级别越高。如果这个层次,有优先级级别最高的出现,那么就选此从库做为 Master,选举就结束了,如果优先级相同,那么进入下一轮打分。 看图:

第二轮:与主库的同步进度越接近

===============

肯定是从库的数据越新,那么选择它作为新的 Master,才最有意义了。那怎么才能知道哪个从库才是最新的呢?

我们之前上一篇 redis 主从原理,从库会记录自己同步主库的进度,这个参数为 slave_repl_offset , 是累加的,也就是这个值越大,那么它们谁同步的数据就是最新的,得分就是最高的,选举就结束了,如果复制进度相同,那么还需要进入下一轮,比较 ID。 看图:

第三轮:ID 号越小,得分越高

===============

比较自己的 ID【redis 在启动的时候,会给自己分配一个 ID】,ID 越小,自己得分就越高。

最多经历三轮打分,主库就会被重新选出,那么哨兵就会通知其他从库执行 replicaof 指向新的主库,进行主从切换,这里有一个细节,需要注意,不知道你没有想到,就是由哪个哨兵来执行主从切换呢?

哨兵选举 Leader

===========

其实由哪个哨兵来进行发号施令,进行主从切换,这个哨兵是需要进行选举的其实由哪个哨兵来进行发号施令,进行主从切换,这个哨兵是需要进行选举的。

本篇前面说过,判断主库是否下线是需要进行主观下线和客观下线两个过程,自己先标记为主观下线,当多数都标记为主观下线的时候,那么就认为客观下线了,那么这个多数应该是多少呢,其实是通过 quorum 配置项配置的,如果我们有三个哨兵,quorum 配置为 2 ,那么除了自己判断主观下线,还需要一个哨兵也需要判断为主观下线,那么此时才会进入客观下线了,这个判断的过程,其实就是一个投票的过程,包括自己给自己投一票,还包括向其他实例发送 is-master-down-by-addr 命令,询问其他实例,自己判断的这个主库是不是下下了,如果得到对方的响应,那么自己的票数就累加,哨兵投过票了,就不会给其他哨兵再次投票了。

这里具体看图:

这个图只是简单地为了说明,哨兵 B 和哨兵 C 都发现了 redis Master 为主观下线了,但是哨兵 B 优先给其他哨兵发了 is-master-down-by-addr 命令,并得到了哨兵 C 的回复,那么加上自己给自己的投票,那么就是得票数为 2 ,大于等于 quorum 的配置值 2,此时主库标记为客观下线.

如果哨兵 B 要想成为 Leader,那么还要同时满足得到的票数大于等于哨兵(n/2 + 1)数量才可以成为 leader,这里由于我们有三个哨兵,票数过半的话,也就是大于等于 2,所以此时哨兵 B 可以成为 Leader 了。

所以称为 leader 要满足的条件为:

  • 得到的票数要达到配置的 quorum 阀值。

  • 获得哨兵半数以上的票数。

通知

==

哨兵 B Leader 可以主持主从切换了,通知其他从库执行 replicaof 到新的 Master,主从切换完成之后,还会通知连接 redis 的客户端,告诉它们新的 Master 的地址和端口。

这里在说下是怎么通知 redis 客户端 Master 要换新的 ip 和端口了呢?

其实 redis 客户端可以定于哨兵的主从切换事件,当完成主从切换后,哨兵就发送这个事件的结果,那么订阅了这个事件的 redis 客户端都会收到通知,此时 redis 客户端就可以更新到新的 Master 的地址了。

如果出现网络断开或者抖动,没有收到订阅事件的通知,那么其实还可以调用哨兵提供的接口,进行重新拉取。

通知模型:

总结

==

今天主要是熟悉哨兵的工作原理和过程,下面来做下总结:

哨兵都干了什么?

========

监控、选主、通知。

监控:

===

监控主从节点是否下线,从节点可以简单认为没有收到响应就直接下线,因为从节点下线一般不会影响到集群的使用。

主节点的下线,分为主观下线和客观下线,只有在多数都认为是主观下线了,才认为是客观下线了。

选主:

===

首先进行筛选,把标记为下线的从库,网络不稳定的从库晒出掉。

接下来进行打分,主要会分三个阶段:分别从 从库的优先级、复制进度、ID 大小来进行打分。

通知:

===

通知其他从库执行 replicaof 到新的 Master,主从切换完成之后,还会通知连接 redis 的客户端,告诉它们新的 Master 的地址和端口。

哨兵选举过程:

=======

哨兵投票机制:

=======

a:哨兵实例只有在自己判定主库下线时,才会给自己投票,而其他的哨兵实例会把票投给第一个来要票的请求,其后的都拒绝。

b:如果出现多个哨兵同时发现主库下线并给自己投票,导致投票选举失败,就会触发新一轮投票,直至成功。

哨兵成为 Leader 的必要条件:

==================

a:获得半数以上的票数。

b:得到的票数要达到配置的 quorum 阀值。

注意的点

====

在 master 关掉 到 主从切换完成,通知完客户端,这个期间,所有的写请求是不能处理的,因为 master 已经挂掉了,如果采用的是读写分离,所有的读请求就是可以正常处理的,读请求会被分到从库上去。如果此时想让业务感知不到异常,可以采取相应的降级策略,可以让写请求先写入到 mq 中,等待恢复之后,再写入到新的 master 就可以了。

这里在强调一下哨兵进行主从切换的前提条件,必须要选择出哨兵 Leader,由 Leader 进行通知从进行主从切换和通知客户端更换新的 Master 的地址和端口。

在这里举个例子,如果有 5 个哨兵,quorum 配置为 2,那么要想成为 Leader,那么获得票数必须要达到 2 才能判断一个主库为客观下线,同时获得票数也要大于等于(n/2) + 1 的票数,也就是获得 3 以上才可以。如果此时有 3 个哨兵故障了,即使你获得了 2 票,能判断为客观下线,那么由于没有过半的哨兵数量,也是无法选举出 Leader ,也就无法进行下面的过程了,此时集群就玩完了。

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

img

最后

分享一套我整理的面试干货,这份文档结合了我多年的面试官经验,站在面试官的角度来告诉你,面试官提的那些问题他最想听到你给他的回答是什么,分享出来帮助那些对前途感到迷茫的朋友。

面试经验技巧篇
  • 经验技巧1 如何巧妙地回答面试官的问题
  • 经验技巧2 如何回答技术性的问题
  • 经验技巧3 如何回答非技术性问题
  • 经验技巧4 如何回答快速估算类问题
  • 经验技巧5 如何回答算法设计问题
  • 经验技巧6 如何回答系统设计题
  • 经验技巧7 如何解决求职中的时间冲突问题
  • 经验技巧8 如果面试问题曾经遇见过,是否要告知面试官
  • 经验技巧9 在被企业拒绝后是否可以再申请
  • 经验技巧10 如何应对自己不会回答的问题
  • 经验技巧11 如何应对面试官的“激将法”语言
  • 经验技巧12 如何处理与面试官持不同观点这个问题
  • 经验技巧13 什么是职场暗语

面试真题篇
  • 真题详解1 某知名互联网下载服务提供商软件工程师笔试题
  • 真题详解2 某知名社交平台软件工程师笔试题
  • 真题详解3 某知名安全软件服务提供商软件工程师笔试题
  • 真题详解4 某知名互联网金融企业软件工程师笔试题
  • 真题详解5 某知名搜索引擎提供商软件工程师笔试题
  • 真题详解6 某初创公司软件工程师笔试题
  • 真题详解7 某知名游戏软件开发公司软件工程师笔试题
  • 真题详解8 某知名电子商务公司软件工程师笔试题
  • 真题详解9 某顶级生活消费类网站软件工程师笔试题
  • 真题详解10 某知名门户网站软件工程师笔试题
  • 真题详解11 某知名互联网金融企业软件工程师笔试题
  • 真题详解12 国内某知名网络设备提供商软件工程师笔试题
  • 真题详解13 国内某顶级手机制造商软件工程师笔试题
  • 真题详解14 某顶级大数据综合服务提供商软件工程师笔试题
  • 真题详解15 某著名社交类上市公司软件工程师笔试题
  • 真题详解16 某知名互联网公司软件工程师笔试题
  • 真题详解17 某知名网络安全公司校园招聘技术类笔试题
  • 真题详解18 某知名互联网游戏公司校园招聘运维开发岗笔试题

资料整理不易,点个关注再走吧
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门即可获取!
机制造商软件工程师笔试题

  • 真题详解14 某顶级大数据综合服务提供商软件工程师笔试题
  • 真题详解15 某著名社交类上市公司软件工程师笔试题
  • 真题详解16 某知名互联网公司软件工程师笔试题
  • 真题详解17 某知名网络安全公司校园招聘技术类笔试题
  • 真题详解18 某知名互联网游戏公司校园招聘运维开发岗笔试题

[外链图片转存中…(img-mRjIedTK-1712508700108)]

资料整理不易,点个关注再走吧
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》点击传送门即可获取!

  • 26
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值