一、分片集群结构
主从和哨兵可以解决高可用,高并发读的问题。但是依然有两个问题没有解决:
- 海量数据存储问题
- 高并发写的问题
使用分片集群可以解决上述问题,分片集群特征:
- 集群中有多个master,每个master保存不同数据
- 每个master都可以有多个slave节点
- master之间通过ping监测彼此健康状态
二、搭建分片集群
1、集群架构
分片集群需要的节点数量较多,这里我们搭建一个最小的分片集群,包含3个master节点,每个master包含一个slave节点,结构如下:
这里我们会在同一台虚拟机开启6个redis实例,模拟分片集群,信息如下:
IP | PORT | 角色 |
---|---|---|
192.168.0.101 | 7001 | master |
192.168.0.101 | 7002 | master |
192.168.0.101 | 7003 | master |
192.168.0.101 | 8001 | slave |
192.168.0.101 | 8002 | slave |
192.168.0.101 | 8003 | slave |
2、准备实例和配置
创建目录
cd /tmp
mkdir 7001 7002 7003 8001 8002 8003
在/tmp下准备一个新的redis.conf文件,内容如下:
port 6379
# 开启集群功能
cluster-enabled yes
# 集群的配置文件名称,不需要我们创建,由redis自己维护
cluster-config-file /tmp/6379/nodes.conf
# 节点心跳失败的超时时间
cluster-node-timeout 5000
# 持久化文件存放目录
dir /tmp/6379
# 绑定地址
bind 0.0.0.0
# 让redis后台运行
daemonize yes
# 注册的实例ip
replica-announce-ip 192.168.150.101
# 保护模式
protected-mode no
# 数据库数量
databases 1
# 日志
logfile /tmp/6379/run.log
将这个文件拷贝到每个目录下:
# 进入/tmp目录
cd /tmp
# 执行拷贝
echo 7001 7002 7003 8001 8002 8003 | xargs -t -n 1 cp redis.conf
修改每个目录下的redis.conf,将其中的6379修改为与所在目录一致:
# 进入/tmp目录
cd /tmp
# 修改配置文件
printf '%s\n' 7001 7002 7003 8001 8002 8003 | xargs -I{} -t sed -i 's/6379/{}/g' {}/redis.conf
3.启动
# 进入/tmp目录
cd /tmp
3、一键启动所有服务
printf '%s\n' 7001 7002 7003 8001 8002 8003 | xargs -I{} -t redis-server {}/redis.conf
通过ps查看状态:
ps -ef | grep redis
发现服务都已经正常启动:
4、搭建集群
Redis5.0之前
# 安装依赖
yum -y install zlib ruby rubygems
gem install redis
#然后通过命令来管理集群:
# 进入redis的src目录
cd /tmp/redis-6.2.4/src
# 创建集群
./redis-trib.rb create --replicas 1 192.168.150.101:7001 192.168.150.101:7002 192.168.150.101:7003 192.168.150.101:8001 192.168.150.101:8002 192.168.150.101:8003
Redis5.0之后
执行命令:
redis-cli --cluster create --cluster-replicas 1 192.168.150.101:7001 192.168.150.101:7002 192.168.150.101:7003 192.168.150.101:8001 192.168.150.101:8002 192.168.150.101:8003
命令说明:
-
redis-cli --cluster或者./redis-trib.rb:代表集群操作命令
-
create:代表是创建集群
-
–replicas 1或者–cluster-replicas 1 :指定集群中每个master的副本个数为1,此时节点总数 ÷ (replicas + 1) 得到的就是master的数量。因此节点列表中的前n个就是master,其它节点都是slave节点,随机分配到不同master
本示例中,节点总数是6,副本是1,所以有3个master分片,因此默认命令的前三个就是master节点。
执行命令如下:
可以看出master节点是7001,7002,7003,注意每个节点对应的插槽slots范围。
5、查看集群状态
redis-cli -p 7001 cluster nodes
三、散列插槽
Redis会把每一个master节点映射到0~16383共16384个插槽(hash slot)上,查看集群信息时就能看到:
数据key不是与节点绑定,而是与插槽绑定。redis会根据key的有效部分计算插槽值,分两种情况:
- key中包含"{“,且”{}“中至少包含1个字符,”{}"中的部分是有效部分
- key中不包含"{}",整个key都是有效部分
例如:key是num,那么根据num计算,如果是{itcast}num,则根据itcast计算。计算方式是利用CRC16算法得到一个hash值,然后对16384取余,得到的结果就是slot值。
1、测试插槽
我们先连接到7001,注意一定要加-c表示集群模式
redis-cli -c -p 7001
1)、我们保存num=123,发现hash计算之后保存到了7001节点
2)、当我们保存a=1,经过hash计算,跳转到7003存储
3)、当我们在7003获取num时,发现跳转回了7001
说明集群生效,数据被分片存储了
2、redis如何判断某个key应该在哪个示例
- 将16384个插槽分配到不同的实例
- 根据key的有效部分计算哈希值,对16384取余
- 余数作为插槽,寻找插槽锁在实例即可
3、如何将同一类数据固定的保存在同一个redis示例
这一类数据使用相同的有效部分,例如key都以{typeId}为前缀
例如,我们需要把食品类的商品存入到一个redis中,则set {FOOD}:apple = xxx;
示例:由于在num前面加了前缀,所以计算hash,插槽在7003
四、集群伸缩
1、添加一个节点到集群
2、向集群中添加一个新的master节点,并向其中存储num = 10
需求:
- 启动一个新的redis实例,端口是7004
- 添加7004到之前的集群,并作为一个master节点
- 给7004节点分配插槽,使的num这个key可以存储到7004,原本num这个key是存储在7001
2.1、创建配置
# 创建7004
cd /tmp
mkdir 7004
# 拷贝文件
cp -rp redis.conf 7004
# 修改端口
sed -i s /6379/7004/g 7004/redis.conf
2.2、运行
redis-server 7004/redis.conf
2.3、查看运行状态
ps -ef | grep redis
2.4、添加到集群
添加新节点,并设置一个当前已经存在的节点比如7001,将来是从7001分配插槽
redis-cli --cluster add-node 192.168.150.101:7004 192.168.150.101:7001
2.5、查看集群状态
redis-cli -p 7001 cluster nodes
此时发现,7004已经是master节点,但是还没有从7001分配插槽
2.6、重新分片,分配插槽
# 1、对7001重新分配插槽
redis-cli --cluster reshard 192.168.150.101:7001
# 2、提示你想要移动多少插槽
# How many slots do you want to move (from 1 to 16384)?
# 我们计划是1-3000分配给7004,所以输入3000之后提示如下谁来接收插槽
# 3、What is the receiving node ID?
# 输入7004的ID
# 4、提示从哪个数据源ID拷贝,我们从7001拷贝,如果粘贴7001的实例ID
# source node #1: 7001的ID
# 5、结束
# source node #2: done
# 6、由于0-3000的插槽原本有数据存储在7001,所以会提示是否需要把他们移动到7004,我们确定是
那我们就复制7004的ID
过程
2.7、最后查看移动之后的效果
五、故障转移
1、概念
当集群中一个master宕机会发生设么呢?
- 首先是该实例与其他实例失去连接
- 然后是疑似宕机
- 最后是确定下线,自动提升一个slave为新的master
2、测试宕机
测试让7002这个master节点宕机
redis-cli -p 7002 shutdown
此时查询状态,我们发现8003变成了master,并且7002显示fail
测试7002恢复
redis-server -p 7002/redis.cinf
3、数据迁移
利用cluster failover命令可以手动让集群中的某个master宕机,切换到执行cluster failover命令的这个slave节点,实现无感知的数据迁移,其中流程如下:
手动的Failover支持三种不同不是:
- 缺省:默认的流程,如图1-6步
- force:省略了对offset的一致性校验
- takeover:直接执行第5步,忽略数据一致性、忽略master状态和其他master的意见。
在7002这个节点执行手动故障转移,重新夺回master地位
# 利用redis-cli连接7002这个节点
redis-cli -p 7002
# 执行cluster failover命令
127.0.0.1:7002> CLUSTER FAILOVER
OK
此时再次查看集群状态,7002重新回到master节点,如下图:
六、RedisTemplate访问分片集群
RedisTemplate底层同样基于lettuce实现了分片集群的支持,而使用的步骤与哨兵模式基本一致:
- 引入redis的starter依赖
- 配置分片集群地址
- 配置读写分离
与哨兵模式相比,其中只有分片集群的配置方式略有差异,如下:
spring:
redis:
cluster:
nodes:
- 192.168.150.101:7001
- 192.168.150.101:7002
- 192.168.150.101:7003
- 192.168.150.101:8001
- 192.168.150.101:8002
- 192.168.150.101:8003
1、设置 set num
我们发现num这个key存在7001
2、查询 get num
我们发现num这个key是存在7001和8002,而8002是从节点,说明也实现了读写分离。