一文带你彻底吃透Redis Cluster集群，干货满满，速来

本文链接：https://blog.csdn.net/2401_85358350/article/details/140482869

比如有100个数据，对每个数据进行hash运算之后，与节点数进行取余运算，根据余数不同保存在不同的节点上

一文彻底吃透Redis Cluster集群，干货满满，速来

节点取余方式是非常简单的一种分区方式

节点取余分区方式有一个问题：即当增加或减少节点时，原来节点中的80%的数据会进行迁移操作，对所有数据重新进行分布

节点取余分区方式建议使用多倍扩容的方式，例如以前用3个节点保存数据，扩容为比以前多一倍的节点即6个节点来保存数据，这样只需要适移50%的数据。数据迁移之后，第一次无法从缓存中读取数据，必须先从数据库中读取数据，然后回写到缓存中，然后才能从缓存中读取迁移之后的数据

一文彻底吃透Redis Cluster集群，干货满满，速来

节点取余方式优点：

1.主从复制不能实现高可用

2.随着公司发展，用户数量增多，并发越来越多，业务需要更高的QPS，而主从复制中单机的QPS可能无法满足业务需求

3.数据量的考虑，现有服务器内存不能满足业务数据的需要时，单纯向服务器添加内存不能达到要求，此时需要考虑分布式需求，把数据分布到不同服务器上

4.网络流量需求：业务的流量已经超过服务器的网卡的上限值，可以考虑使用分布式来进行分流

5.离线计算，需要中间环节缓冲等别的需求

节点取余方式缺点：

数据节点伸缩时，导致数据迁移

迁移数量和添加节点数据有关，建议翻倍扩容

2.3.2 一致性哈希分区

=============

一致性哈希原理：

将所有的数据当做一个token环，token环中的数据范围是0到2的32次方。然后为每一个数据节点分配一个token范围值，这个节点就负责保存这个范围内的数据。

一文彻底吃透Redis Cluster集群，干货满满，速来

对每一个key进行hash运算，被哈希后的结果在哪个token的范围内，则按顺时针去找最近的节点，这个key将会被保存在这个节点上。

一文彻底吃透Redis Cluster集群，干货满满，速来

在上面的图中，有4个key被hash之后的值在在n1节点和n2节点之间，按照顺时针规则，这4个key都会被保存在n2节点上，如果在n1节点和n2节点之间添加n5节点，当下次有key被hash之后的值在n1节点和n5节点之间，这些key就会被保存在n5节点上面了。

在上面的例子里，添加n5节点之后，数据迁移会在n1节点和n2节点之间进行，n3节点和n4节点不受影响，数据迁移范围被缩小很多。

同理，如果有1000个节点，此时添加一个节点，受影响的节点范围最多只有千分之2。

一致性哈希一般用在节点比较多的时候。

一致性哈希分区优点：

采用客户端分片方式：哈希 + 顺时针(优化取余)

节点伸缩时，只影响邻近节点，但是还是有数据迁移

一致性哈希分区缺点：

翻倍伸缩，保证最小迁移数据和负载均衡

2.3.3 虚拟槽分区

===========

虚拟槽分区是Redis Cluster采用的分区方式

预设虚拟槽，每个槽就相当于一个数字，有一定范围。每个槽映射一个数据子集，一般比节点数大

Redis Cluster中预设虚拟槽的范围为0到16383

一文彻底吃透Redis Cluster集群，干货满满，速来

步骤：

把16384槽按照节点数量进行平均分配，由节点进行管理
对每个key按照CRC16规则进行hash运算
把hash结果对16383进行取余
把余数发送给Redis节点
节点接收到数据，验证是否在自己管理的槽编号的范围，如果在自己管理的槽编号范围内，则把数据保存到数据槽中，然后返回执行结果，如果在自己管理的槽编号范围外，则会把数据发送给正确的节点，由正确的节点来把数据保存在对应的槽中。

需要注意的是：Redis Cluster的节点之间会共享消息，每个节点都会知道是哪个节点负责哪个范围内的数据槽

虚拟槽分布方式中，由于每个节点管理一部分数据槽，数据保存到数据槽中。当节点扩容或者缩容时，对数据槽进行重新分配迁移即可，数据不会丢失。

虚拟槽分区特点：

使用服务端管理节点，槽，数据：例如Redis Cluster

可以对数据打散，又可以保证数据分布均匀

2.3 顺序分布与哈希分布的对比

================

一文彻底吃透Redis Cluster集群，干货满满，速来

3.Redis Cluster基本架构

===================

3.1 节点

======

Redis Cluster是分布式架构：即Redis Cluster中有多个节点，每个节点都负责进行数据读写操作

每个节点之间会进行通信。

3.2 meet操作

==========

节点之间会相互通信

meet操作是节点之间完成相互通信的基础，meet操作有一定的频率和规则

一文彻底吃透Redis Cluster集群，干货满满，速来

3.3 分配槽

=======

把16384个槽平均分配给节点进行管理，每个节点只能对自己负责的槽进行读写操作

由于每个节点之间都彼此通信，每个节点都知道另外节点负责管理的槽范围

一文彻底吃透Redis Cluster集群，干货满满，速来

客户端访问任意节点时，对数据key按照CRC16规则进行hash运算，然后对运算结果对16383进行取作，如果余数在当前访问的节点管理的槽范围内，则直接返回对应的数据

如果不在当前节点负责管理的槽范围内，则会告诉客户端去哪个节点获取数据，由客户端去正确的节点获取数据

一文彻底吃透Redis Cluster集群，干货满满，速来

3.4 复制

======

保证高可用，每个主节点都有一个从节点，当主节点故障，Cluster会按照规则实现主备的高可用性

对于节点来说，有一个配置项：cluster-enabled，即是否以集群模式启动

3.5 客户端路由

=========

3.5.1 moved重定向

==============

每个节点通过通信都会共享Redis Cluster中槽和集群中对应节点的关系
客户端向Redis Cluster的任意节点发送命令，接收命令的节点会根据CRC16规则进行hash运算与16383取余，计算自己的槽和对应节点
如果保存数据的槽被分配给当前节点，则去槽中执行命令，并把命令执行结果返回给客户端
如果保存数据的槽不在当前节点的管理范围内，则向客户端返回moved重定向异常
客户端接收到节点返回的结果，如果是moved异常，则从moved异常中获取目标节点的信息
客户端向目标节点发送命令，获取命令执行结果

一文彻底吃透Redis Cluster集群，干货满满，速来

需要注意的是：客户端不会自动找到目标节点执行命令

槽命中：直接返回

一文彻底吃透Redis Cluster集群，干货满满，速来

[root@mysql ~]# redis-cli -p 9002 cluster keyslot hello

(integer) 866

槽不命中：moved异常

[root@mysql ~]# redis-cli -p 9002 cluster keyslot php

(integer) 9244

一文彻底吃透Redis Cluster集群，干货满满，速来

[root@mysql ~]# redis-cli -c -p 9002

127.0.0.1:9002> cluster keyslot hello

(integer) 866

127.0.0.1:9002> set hello world

-> Redirected to slot [866] located at 192.168.81.100:9003

192.168.81.100:9003> cluster keyslot python

(integer) 7252

192.168.81.100:9003> set python best

-> Redirected to slot [7252] located at 192.168.81.101:9002

192.168.81.101:9002> get python

“best”

192.168.81.101:9002> get hello

-> Redirected to slot [866] located at 192.168.81.100:9003

“world”

192.168.81.100:9003> exit

[root@mysql ~]# redis-cli -p 9002

127.0.0.1:9002> cluster keyslot python

(integer) 7252

127.0.0.1:9002> set python best

127.0.0.1:9002> set hello world

(error) MOVED 866 192.168.81.100:9003

127.0.0.1:9002> exit

[root@mysql ~]#

3.5.2 ask重定向

================

一文彻底吃透Redis Cluster集群，干货满满，速来

在对集群进行扩容和缩容时，需要对槽及槽中数据进行迁移

当客户端向某个节点发送命令，节点向客户端返回moved异常，告诉客户端数据对应的槽的节点信息

如果此时正在进行集群扩展或者缩空操作，当客户端向正确的节点发送命令时，槽及槽中数据已经被迁移到别的节点了，就会返回ask，这就是ask重定向机制

一文彻底吃透Redis Cluster集群，干货满满，速来

步骤：

客户端向目标节点发送命令，目标节点中的槽已经迁移支别的节点上了，此时目标节点会返回ask转向给客户端
客户端向新的节点发送Asking命令给新的节点，然后再次向新节点发送命令
新节点执行命令，把命令执行结果返回给客户端

moved异常与ask异常的相同点和不同点

两者都是客户端重定向

moved异常：槽已经确定迁移，即槽已经不在当前节点

ask异常：槽还在迁移中

3.5.3 smart智能客户端

================

使用智能客户端的首要目标：追求性能

从集群中选一个可运行节点，使用Cluster slots初始化槽和节点映射

将Cluster slots的结果映射在本地，为每个节点创建JedisPool，相当于为每个redis节点都设置一个JedisPool，然后就可以进行数据读写操作

读写数据时的注意事项：

每个JedisPool中缓存了slot和节点node的关系

key和slot的关系：对key进行CRC16规则进行hash后与16383取余得到的结果就是槽

JedisCluster启动时，已经知道key,slot和node之间的关系，可以找到目标节点

JedisCluster对目标节点发送命令，目标节点直接响应给JedisCluster

如果JedisCluster与目标节点连接出错，则JedisCluster会知道连接的节点是一个错误的节点

此时JedisCluster会随机节点发送命令，随机节点返回moved异常给JedisCluster

JedisCluster会重新初始化slot与node节点的缓存关系，然后向新的目标节点发送命令，目标命令执行命令并向JedisCluster响应

如果命令发送次数超过5次，则抛出异常"Too many cluster redirection!"

一文彻底吃透Redis Cluster集群，干货满满，速来

3.6 多节点命令实现

===========

Redis Cluster不支持使用scan命令扫描所有节点

多节点命令就是在在所有节点上都执行一条命令

批量操作优化

3.6.1 串行mget

============

定义for循环，遍历所有的key，分别去所有的Redis节点中获取值并进行汇总，简单，但是效率不高，需要n次网络时间

一文彻底吃透Redis Cluster集群，干货满满，速来

3.6.2 串行IO

==========

对串行mget进行优化，在客户端本地做内聚，对每个key进行CRC16hash，然后与16383取余，就可以知道哪个key对应的是哪个槽

本地已经缓存了槽与节点的对应关系，然后对key按节点进行分组，成立子集，然后使用pipeline把命令发送到对应的node，需要nodes次网络时间，大大减少了网络时间开销

一文彻底吃透Redis Cluster集群，干货满满，速来

3.6.3 并行IO

==========

并行IO是对串行IO的一个优化，把key分组之后，根据节点数量启动对应的线程数，根据多线程模式并行向node节点请求数据，只需要1次网络时间

一文彻底吃透Redis Cluster集群，干货满满，速来

3.6.4 hash_tag

===============

将key进行hash_tag的包装，然后把tag用大括号括起来，保证所有的key只向一个node请求数据，这样执行类似mget命令只需要去一个节点获取数据即可，效率更高

一文彻底吃透Redis Cluster集群，干货满满，速来

3.6.5 四种优化方案优缺点分析

=================

一文彻底吃透Redis Cluster集群，干货满满，速来

3.7 故障发现

========

Redis Cluster通过ping/pong消息实现故障发现：不需要sentinel

ping/pong不仅能传递节点与槽的对应消息，也能传递其他状态，比如：节点主从状态，节点故障等

故障发现就是通过这种模式来实现，分为主观下线和客观下线

3.7.1 主观下线

==========

某个节点认为另一个节点不可用，‘偏见’，只代表一个节点对另一个节点的判断，不代表所有节点的认知

主观下线流程：

节点1定期发送ping消息给节点2。
如果发送成功，代表节点2正常运行，节点2会响应PONG消息给节点1，节点1更新与节点2的最后通信时间。
如果发送失败，则节点1与节点2之间的通信异常判断连接，在下一个定时任务周期时，仍然会与节点2发送ping消息。
如果节点1发现与节点2最后通信时间超过node-timeout，则把节点2标识为pfail状态。

一文彻底吃透Redis Cluster集群，干货满满，速来

3.7.2 客观下线

==============

当半数以上持有槽的主节点都标记某节点主观下线时，可以保证判断的公平性

集群模式下，只有主节点(master)才有读写权限和集群槽的维护权限，从节点(slave)只有复制的权限

客观下线流程：

1.某个节点接收到其他节点发送的ping消息，如果接收到的ping消息中包含了其他pfail节点，这个节点会将主观下线的消息内容添加到自身的故障列表中，故障列表中包含了当前节点接收到的每一个节点对其他节点的状态信息

2.当前节点把主观下线的消息内容添加到自身的故障列表之后，会尝试对故障节点进行客观下线操作

故障列表的周期为：集群的node-timeout * 2，保证以前的故障消息不会对周期内的故障消息造成影响，保证客观下线的公平性和有效性

一文彻底吃透Redis Cluster集群，干货满满，速来

3.8 故障恢复

========

3.8.1 资格检查

==========

对从节点的资格进行检查，只有难过检查的从节点才可以开始进行故障恢复
每个从节点检查与故障主节点的断线时间
超过cluster-node-timeout * cluster-slave-validity-factor数字，则取消资格
cluster-node-timeout默认为15秒，cluster-slave-validity-factor默认值为10
如果这两个参数都使用默认值，则每个节点都检查与故障主节点的断线时间，如果超过150秒，则这个节点就没有成为替换主节点的可能性

3.9.2 准备选举时间

================

使偏移量最大的从节点具备优先级成为主节点的条件

一文彻底吃透Redis Cluster集群，干货满满，速来

3.8.3 选举投票

==============

对选举出来的多个从节点进行投票，选出新的主节点

一文彻底吃透Redis Cluster集群，干货满满，速来

3.8.4 替换主节点

===============

当前从节点取消复制变成离节点(slaveof no one)

执行cluster del slot撤销故障主节点负责的槽，并执行cluster add slot把这些槽分配给自己

向集群广播自己的pong消息，表明已经替换了故障从节点

3.8.5 故障转移演练

================

对某一个主节点执行kill -9 {pid}来模拟宕机的情况

3.9 Redis Cluster的缺点

====================

当节点数量很多时，性能不会很高

解决方式：使用智能客户端。智能客户端知道由哪个节点负责管理哪个槽，而且当节点与槽的映射关系发生改变时，客户端也会知道这个改变，这是一种非常高效的方当节点数量很多时，性能不会很高解决方式：使用智能客户端。智能客户端知道由哪个节点负责管理哪个槽，而且当节点与槽的映射关系发生改变时，客户端也会知道这个改变，这是一种非常高效的方式

4.搭建Redis Cluster

=====================

搭建Redis Cluster有两种安装方式