Redis知识点总结--3

Redis Sentinel提供了一套高可用解决方案,通过监控、通知、故障转移和配置提供等功能确保Redis集群的稳定性。当主节点故障时,Sentinel节点会进行主观下线和客观下线判断,然后通过选举选出领导者执行故障转移,选择合适的从节点晋升为主节点。客户端连接Sentinel以获取主节点信息,实现自动故障切换。Sentinel节点间的共识机制避免了误判,并保证了系统的健壮性。
摘要由CSDN通过智能技术生成

Redis知识点总结–1
Redis知识点总结–2

7.哨兵

7.1 主从复制的问题

Redis的主从复制模式可以将主节点的数据改变同步给从节点,这样从节点就可以起到两个作用:第一,作为主节点的一个备份,一旦主节点出了故障不可达的情况,从节点可以作为后备“顶”上来,并且保证数据尽量不丢失(主从复制是最终一致性)。第二,从节点可以扩展主节点的读能力,一旦主节点不能支撑住大并发量的读操作,从节点可以在一定程度上帮助主节点分担读压力。
但是主从复制也带来了以下问题:
① 一旦主节点出现故障,需要手动将一个从节点晋升为主节点,同时需要修改应用方的主节点地址,还需要命令其他从节点去复制新的主节点,整个过程都需要人工干预;
② 主节点的写能力受到单机的限制;
③ 主节点的存储能力受到单机的限制。

7.2 Redis Sentinel的高可用

当主节点出现故障时,Redis Sentinel能自动完成故障发现和故障转移,并通知应用方,从而实现真正的高可用。
Redis Sentinel是一个分布式架构,其中包含若干个Sentinel节点和Redis数据节点,每个Sentinel节点会对数据节点和其余Sentinel节点进行监控,当它发现节点不可达时,会对节点做下线标识。如果被标识的是主节点,它还会和其他Sentinel节点进行“协商”,当大多数Sentinel节点都认为主节点不可达时,它们会选举出一个Sentinel节点来完成自动故障转移的工作,同时会将这个变化实时通知给Redis应用方。整个过程完全是自动的,不需要人工介入,所以这套方案很有效地解决了Redis的高可用问题。
Redis Sentinel与Redis主从复制模式只是多出了若干Sentinel节点,所以Redis Sentinel并没有针对Redis节点做了特殊处理。
在这里插入图片描述
从逻辑架构上看,Sentinel节点集合会定期对所有节点进行监控,特别是对主节点的故障实现自动转移。
下面以1个主节点、两个从节点、3个Sentinel节点组成的Redis Sentinel为例进行说明,拓扑结构如下图所示:
在这里插入图片描述
整个故障转移的处理逻辑有下面4个步骤:
1) 如下图所示,主节点出现故障,此时两个从节点与主节点失去连接,主从复制失败。
在这里插入图片描述

2) 每个Sentinel节点通过定期监控发现主节点出现故障:
在这里插入图片描述

3) 多个Sentinel节点对主节点的故障达成一致,选举出Sentinel-3节点作为领导者负责故障转移。
在这里插入图片描述

4) Sentinel领导者执行了故障转移。
在这里插入图片描述

5) 故障转移后整个Redis Sentinel的拓扑结构图如下:
在这里插入图片描述

通过上面介绍的Redis Sentinel逻辑架构以及故障转移的处理,可以看出Redis Sentinel具有以下几个功能:
① 监控:Sentinel节点会定期检测Redis数据节点、其余Sentinel节点是否可达;
② 通知:Sentinel节点会将故障转移的结果通知给应用方;
③ 主节点故障转移:实现从节点晋升为主节点并维护后序正确的主从关系;
④ 配置提供者:在Redis Sentinel结构中,客户端在初始化的时候连接的是Sentinel节点集合,从中获取主节点信息;
同时看到,Redis Sentinel包含了若干Sentinel节点,这样做也带来了两个好处:
① 对于节点的故障判断是由多个Sentinel节点共同完成的,这样可以有效地防止误判;
② Sentinel节点集合是由若干个Sentinel节点组成的,这样即使个别Sentinel节点不可用,整个Sentinel节点集合依然是健壮的。
但是Sentinel节点本身就是独立的Redis节点,只不过它们有一些特殊,它们不存储数据,只支持部分命令。

7.3 实现原理
7.3.1 三个定时监控任务

一套合理的监控和机制是Sentinel节点判定节点不可达的重要保证,Redis Sentinel通过三个定时监控任务完成对各个节点发现和监控:
1) 每个10秒,每个Sentinel节点会向主节点和从节点发送info命令获取最新的拓扑结构:
在这里插入图片描述

例如下面就是在一个主节点上执行info replication的结果片段:

# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=6380,state=online,offset=4917,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=4917,lag=1

Sentinel节点通过对上述结果进行解析就可以找到响应的从节点。
这个定时任务的作用具体可以表现在三个方面:
① 通过向主节点执行info命令,获取从节点的信息,这也是为什么Sentinel节点不需要显式配置控制从节点;
② 当有新的从节点加入时都可以立刻感知出来;
③ 节点不可达或者故障转移后,可以通过info命令实时更新节点拓扑信息。
2) 每隔2秒,每个Sentinel节点会向Redis数据节点的_sentinel_:hello频道上发送该Sentinel节点对于主节点的判断以及当前Sentinel节点的信息,同时每个Sentinel节点也会订阅该频道,来了解其他Sentinel节点以及它们对主节点的判断,所以这个定时任务可以完成以下两个工作:
① 发现新的Sentinel节点:通过订阅主节点的_sentinel_:hello了解其他Sentinel节点信息,如果是新加入的Sentinel节点,将该Sentinel节点信息保存起来,并与该Sentinel节点创建连接;
② Sentinel节点之间交换主节点的状态,作为后面客观下线以及领导者选举的依据。
3) 每隔1秒,每个Sentinel节点会向主节点、从节点、其余Sentinel节点发送一条ping命令做一次心跳检查,来确认这些节点当前是否可达。通过上面的定时任务,Sentinel节点对主节点、从节点、其余Sentinel节点都建立起连接,实现了对每个节点的控制,这个定时任务是节点失败判断的重要依据,

7.3.2 主观下线与客观下线

1) 主观下线
上面介绍的第三个定时任务,每个Sentinel节点会每隔1秒对主节点、从节点、其他Sentinel节点发送ping命令做心跳检测,当这些节点超过down-after-milliseconds没有进行有效回复,Sentinel节点就会对该节点做失败判定,这个行为叫做主观下线。即当前Sentinel一家之言,存在误判的可能。
2) 客观下线
当Sentinel主观下线的节点是主节点时,该Sentinel节点会通过sentinel is-master-down-by-addr命令向其他Sentinel节点询问对主节点的判断,当超过个数,Sentinel节点认为主节点确实有问题,这时该Sentinel节点会做出客观下线的决定,这样客观下线的含义是比较明显了,也就是大部分Sentinel节点都对主节点的下线作了同意的判定,那么这个判定就是客观的。
注意:从节点、Sentinel节点在主观下线后,没有后续的故障转移操作。

7.3.3 领导者Sentinel节点选举

假如Sentinel节点对于主节点已经做了客观下线,那么是不是就可以立即进行故障转移了?当然不是,实际上故障转移的工作只需要一个Sentinel节点来完成即可,所以Sentinel节点之间会做一个领导者选举的工作,选出一个Sentinel节点作为领导者进行故障转移的工作。Redis使用了Raft算法实现领导者选举,以下给出一个Redis Sentinel进行领导者选举的大体思路:
1) 每个在线的Sentinel节点都有资格成为领导者,当它确认主节点主观下线时候,会向其他Sentinel节点发送sentinel is-master-down-by-addr命令,要求将自己设置为领导者;
2) 收到命令的Sentinel节点,如果没有同意过其他Sentinel节点的sentinel is-master-down-by-addr命令,将同意该请求,否则拒接;
3) 如果该Sentinel节点发现自己的票数已经大于等于max(quorum,num(sentinels)/2+1),那么它将成为领导者;
4) 如果此过程没有选举出领导者,将进入下一次选举。
下图展示了一次领导者选举的大致过程:
在这里插入图片描述
1) s1(sentinel-1)最先完成了客观下线,它会向s2和s3发送sentinel is-master-down-by-addr命令,s2和s3同意选其为领导者;
2) s1此时已经拿到2张选票,满足了大于等于max(quorum,num(sentinels)/2+1)=2的条件,所以此时s1成为领导者。
由于每个Sentinel节点只有一票,所以当s2向s1和s3索要投票时,只能获取一票,而s3由于最后完成主观下线,当s3向s1和s2索要投票时一票都得不到。

7.3.4 故障转移

领导者选举出的Sentinel节点负责故障转移,具体步骤如下:
1) 在从节点列表中选出一个节点作为新的主节点,选择方法如下:
① 过滤:“不健康”(主观下线、断线)、5秒内没有回复过Sentinel节点ping响应、与主节点失联超过down-after-milliseconds*10秒;
② 选择slave-priority(从节点优先级)最高的从节点列表,如果存在则返回,不存在则继续;
③ 选择复制偏移量最大的从节点(复制的最完整),如果存在则返回,不存在则继续;
④ 选择runid最小的从节点。
在这里插入图片描述
2) Sentinel领导者节点会对第一步选出来的从节点执行slaveof no one命令让其成为主节点;
3) Sentinel领导者节点会向剩余的从节点发送命令,让它们成为新主节点的从节点,复制规则和parallel-syncs参数有关;
4) Sentinel节点集合会将原来的主节点更新为从节点,并保持对其关注,当其回复后命令它去复制新的主节点。

7.3.5 客户端连接

下面将介绍如何正确地连接Redis Sentinel。有人会说这有什么难的,已经知道了主节点的ip地址和端口,用对应编程语言的客户端连接主节点不就可以了吗?但试想一下,如果这样使用客户端,客户端连接Redis Sentinel和主从复制的Redis又有什么区别呢,如果主节点挂掉了。虽然Redis Sentinel可以完成故障转移,但是客户端无法获取这个变化,那么使用Redis Sentinel的意义就不大了,所以各个语言的客户端需要对Redis Sentinel进行显式支持。
1) Redis Sentinel的客户端
Sentinel节点集合具备了监控、通知、自动故障转移、配置提供者若干功能,也就是说实际上最了解主节点信息的就是Sentinel节点结合,而各个主节点可以通过进行标识的,所以,无论是哪种编程语言的客户端,如果需要正确的连接Redis Sentinel,必须有Sentinel节点集合和masterName两个参数。
2) Redis Sentinel客户端基本实现原理
实现一个Redis Sentinel客户端基本步骤如下:
① 遍历Sentinel节点集合获取一个可用的Sentinel节点;
② 通过sentinel get-master-addr-by-name master-name这个API来获取对应主节点的相关信息;
③ 验证当前获取的“主节点”是真正的主节点,这样做的目的是为了防止故障转移期间主节点的变化;
④ 保持和Sentinel节点集合的“联系”,时刻获取关于主节点的相关“信息”。
从以上可以看出,Redis Sentinel客户端只有在初始化和切换主节点时需要和Sentinel节点集合进行交互来获取主节点信息。
3) Java操作Redis Sentinel
Jedis针对Redis Sentinel给出了一个JedisSentinelPool,很显然这个连接池保存的连接还是针对主节点的。Jedis给出很多构造方法,其中最全的如下所示:

public JedisSentinelPool(String masterName,Set<String> sentinel,
final GenericObjectPoolConfig poolConfig,
final int connectionTimeout,
final int soTimeout,
final String password,
final int database,
final String clientName)

具体参数含义如下:

  • masterName:主节点名;
  • sentinels:Sentinel节点集合;
  • poolConfig:common-pool连接池配置;
  • connectTimeout:连接超时;
  • soTimeout:读写超时;
  • password:主节点密码;
  • database:当前数据库索引;
  • clientName:客户端名。

使用JedisSentinelPool:

Jedis jedis= null;
try{
	Jedis = jedisSentinelpool.getResource();
	//jedis command
}catch(Exception e){

}finally{
	if(jedis != null)
	   jedis.close();//归还
}

具体过程如下:
① 遍历Sentinel节点集合,找到一个可用的Sentinel节点,如果找不到就从Sentinel节点集合中去找下一个,如果都找不到直接抛出异常给客户端;

New JedisExcepition(…)

② 找到一个可用的Sentinel节点,执行sentinelGetMasterAddrByName(masterName),找到对应主节点信息;
③ JedisSentinelPool中没有发现对主节点角色验证的代码,这是因为get-master-addr-by-name master-name这个API本身就会自动获取真正的主节点;
④ 为每个Sentinel节点单独启动一个线程,利用Redis的发布订阅功能,每个线程订阅Sentinel节点上切换master的相关频道+switch-master。(它就是Redis Sentinel在结束对主节点故障转移后会发布切换主节点的信息,Sentinel节点基本将故障转移的各个阶段发生的行为都通过这种发布订阅的形式对外提供,当收到信息后,客户端会判断是否为当前masterName,发现当前masterName发生switch,使用initPool重新初始化连接池)。

知识点参考《Redis开发与运维》 付磊 张益军

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值