Redis高可用群集---三种模式详解(主从、哨兵、Cluster)

本文详细介绍了Redis的高可用性解决方案,包括主从复制、哨兵模式和Cluster群集。主从复制提供数据备份,哨兵模式实现自动化故障转移,而Cluster群集则通过分布式存储提升系统性能。哨兵系统监控Redis节点状态,当主节点故障时自动将从节点提升为主节点。Redis Cluster在3.0版本引入,采用P2P模式,无中心节点,通过哈希槽实现数据分布,确保高可用性和扩展性。
摘要由CSDN通过智能技术生成



一、redis群集介绍

  • redis是一个开源的kevvalue存储系统,受到了广大互联网公司的青睐。redis3.0版本之前只支持单例模式,在3.0版本及以后才支持集群 redis集群采用P2P模式,是完全去中心化的,不存在中心节点或者代理节点;

  • 为了实现集群的高可用,即判新节点是否健康(能否正常使用), redis-cluster有一个投票容错机制:
    如果集群中超过半数的节点投票认为某个节点挂了,那么这个节点就挂了(fail)。如果集群中任意一个节点挂了,而且该节点没有从节点(备份节点),那么这个集群就挂了

  • 为什么没有备份节点,集群会挂掉

因为集群内置了16384个slot(哈希槽),并且把所有的物理节点映射到了这16384[0-16383]个slot上,或者说把这些slot均等的分配给了各个节点。
当需要在Redis集群存放一个数据(key-value)时,redis会先对这个key进行crc16算法,然后得到一个结果再把这个结果对16384进行求余,这个余数会对应[0-16383]其中一个槽,进而决定key-value存储到哪个节点中。所以一旦某个节点挂了,该节点对应的slot就无法使用,那么就会导致集群无法正常工作。
示例(三个节点) : 节点A覆盖0-5460; 节点B覆盖5461-10922; 节点C覆盖10923-16383
即:每个节点有5460个哈希槽 新增一个节点: 节占A覆盖1365-5460 节占B覆盖6827-10922
节点C覆盖12288-16383 节点D覆盖0-1364.5461-6826.10923-12287
即:每个节点有4095个哈希槽 综上所述,每个Redis集群理论上最多可以有16384个节点。

二、Redis三种模式介绍

  • 在Redis中,实现高可用的技术主要包括持久化、主从复制、哨兵和集群,下而分别说明它们的作用,以及解决了什么样的问题

1.主从模式

  • 通过持久化功能,redis保证了即使在服务器重启的情况下也不会丢失(或少量丢失)数据,因为持久化会把内存中的数据保存到硬盘上,重启会从硬盘上加载数据,但是由于数据是存储在一台服务器上的,如果这台服务器出现硬盘故障等问题,也会导致数据丢失。
  • 为了避免单点故障,通常的做法是将数据库复制多个副本以部署在不同的服务器上,这样即使有一台服务器出现故障,其他服务器依然可以继续提供服务,为此,redis提供了复制(replication)功能,可以实现当一台数据库中的数据更新后,自动将更新的数据同步到其他数据库上。
  • 在复制的概念中,数据库分为两类,一类是主数据库(master),另一类是从数据(slave)。主数据可以进行读写操作,当写操做导致数据变化时自动将数据同步给数据库,而从数据库一般是只读的,并接收主数据同步过来的数据。一个主数据库可以拥有多个从数据库,而一个从数据库只能拥有一个主数据库

1.1 流程图

mark

  • ① 若启动一个Slave机器进程,则它会向Master机器发送一个"sync_command"命令,请求同步连接

  • ② 无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照(RDB)保存到
    数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。

  • ③ 后台进程完成缓存操作之后,Master机器就会向Slave机器发送数据文件,Slave端机器将数据
    文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。

  • ④ Master机器收到slave端机器的连接后,将其完整的数据文件发送给Slave端机几器,如果Mater同时收到多个slave发来的
    同步请求则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。

2.哨兵模式(Sentinel)

2.1 哨兵模式集群架构

  • 哨兵是Redis集群架构中非常重要的一个组件,哨兵的出现主要是解决了主从复制出现故障时需要人为干预的问题

2.2 哨兵模式主要功能

  • 集群监控:负责监控Redismaster和slave进程是否正常工作
  • 消息通知:如果某个Redis实例有故障,那么哨兵负责发送消息作为报敬通知给管理员
  • 故障转移:如果masternode挂掉了,会自动转移到slave node上
  • 配置中心:如果故障转移发生了,通知client客户端新的master地址

使用一个或者多个哨兵(Sentinel)实例组成的系统,对redis节点进行监控 在主节点出现故障的情况下, 能将从节点中的一个升级为主节点,进行故障转义,保证系统的可用性。

2.3 哨兵们监控整个系统节点的过程(图2)

  • 首先主节点的信息是配置在哨兵(Sentinel)的配置文件中

  • 哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接
    PS:Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消 息,订阅者 (sub) 接收消息。

  • 哨兵会通过命令连接每10s发送一次INFO命令,通过INFO命令,主节点会返回自己的run_id和自己的从节点信息

  • 哨兵会对这些从节点也建立两条连接命令连接和订阅连接

  • 哨兵通过命令连接向从节点发送INFO命令,获取到他的一些信息:
    run id(redis服务器id)
    role(职能)
    从服务器的复制偏移量offset
    其他

  • 通过命令连接向服务器的sentinel:hello频道发送一条消息,内容包括自己的ip端口、run id、配置(后续投票的时候会用到)等

  • 通过订阅连接对服务器的sentinel:hello频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到

  • 解析监听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些
    哨兵节点记录下来

  • 向观察到的其他的哨兵节点建立命令连接----没有订阅连接

2.4 哨兵模式下的故障迁移

  • 主观下线
    哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送PING命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/LOADING/MASTERDOWN)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_S_DOWN主观下线

  • 客观下线
    当一个哨兵节点发现主节点处于主观下线状态是,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线询问命令SENTINEL is-master-down-by-addr

  • master选举
    在认为主节点客观下线的情况下,哨兵节点节点间会发起一次选举,命令为:SENTINEL is-master-down-by-addr
    只是runid这次会将自己的runid带进去,希望接受者将自己设置为主节点。如果超过半数以上的节点返回将该节点标记为leacer的情况下,会有该leader对故障进行迁移

  • ④ 故障转移

####在从节点中挑选出新的主节点
		通讯正常
		优先级排序
		优先级相同时选择offset最大的

###将该节点设置成新的主节点SLAVEOF no one,并确保在后续的INGO命令时 该节点返回状态为master 
###将其他的从节点设置成从新的主节点复制,SLAVEOF命令
###将旧的主节点变成新的主节点的从节点

PS:优缺点
#优点:
		高可用,哨兵模式是基于主从模式的,所有主从模式的优点,哨兵模式都具有有;主从可以自动切换,系统更健壮,可用性更高

#缺点:
		redis比较难支持在线扩容,在群集容量达到上限时在线扩容会变得很复杂

3.Cluster群集

  • redis的哨兵模式基本已经可以实现高可用、读写分离,但是在这种模式每台redis服务器都存储相同的数据,很浪费内存资源,所以在redis3.0上加入了Cluster群集模式,实现了redis的分布式存储,也京是说每台redis节点存储着不同的内容根据官方推荐,集群部署至少要3台以上的master节点,最好使用3主3从六个节点的模式。

  • Cluster群集由多个redis服务器组成的分布式网络服务群集,群集之中有多个master主节点,每一个主节点都可读可写,节点之间会相互通信,两两相连,redis群集无中心节点

  • 在redis-Cluster群集中,可以给每个一个主节点添加从节点,主节点和从节点直接尊循主从模型的特性,当用户需要处理更多读请求的时候,添加从节点可以扩展系统的读性能

  • redis-cluster的故障转移:redis群集的主机节点内置了类似redissentinel的节点故障检测和自动故障转移功能,当群集中的某个主节点下线时,群集中的其他在线主节点会注意到这一点,并且对已经下线的主节点进行故障转移

  • 集群进行故障转移的方法和redis sentinel进行故障转移的方法基本一样,不同的是,在集群里面,故障转移是由集群中其他在线的主节点负责进行的,所以群集不必另外使用redis sentinel


总结

  1. 主从复制
    主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。
    缺陷
       故障恢复无法自动化;
       写操作无法负载均衡;
       存储能力受到单机的限制。
  2. 哨兵
        在主从复制的基础上,哨兵实现了自动化的故障恢复。
    缺陷
       写操作无法负载均衡:存储能力受到单机的限制。
  3. 集群
    通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值