1.数据分布算法

讲解分布式数据存储的核心算法,数据分布的算法

从老到新的算法演变:

hash算法  ->  一致性hash算法 -> redis cluster,hash slot 算法

1) redis cluster基本介绍

(1)自动将数据进行分片,每个master上放一部分数据

(2)提供内置的高可用支持,部分master不可用时,还是可以继续工作的

在redis cluster架构下,每个redis要放开两个端口号,比如一个是6379,另外一个就是加10000的端口号,比如16379

16379端口号是用来进行节点间通信的,也就是cluster bus的东西,集群总线。cluster bus的通信,用来进行故障检测,配置更新,故障转移授权

cluster bus用了另外一种二进制的协议,主要用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间

2) hash算法(最老土,有很多弊端)

计算哈希值, 拿哈希值和master数量取模, 得出取模结果,发布到对应的master上

`最大的弊端,只要一台master宕机,基本上所有的key都会全部失效

3) 一致性hash算法(自动缓存迁移)+ 虚拟节点(自动负载均衡)

一致性hash算法:

如果master宕掉一台: 只会丢失 1/N 的数据

可能会有一个缓存热点的问题,某个master上的数据特别多

为了解决这个问题,引入了虚拟节点,实现负载均衡:

4) redis cluster的hash slot算法:

redis cluster有固定的16384个hash slot,对每个key计算CRC16值,然后对16384取模,可以获取key对应的hash slot

redis cluster中每个master都会持有部分slot,比如有3个master,那么可能每个master持有5000多个hash slot

hash slot让node的增加和移除很简单,增加一个master,就将其他master的hash slot移动部分过去,减少一个master,就将它的hash slot移动到其他master上去

移动hash slot的成本是非常低的

客户端的api,可以对指定的数据,让他们走同一个hash slot,通过hash tag来实现

通过hash slot 可以让数据分布尽量的均匀

某台master宕机之后, redis cluster 会在最短的时间把宕机的master 的hash slot平分给正常运行的master上

2.redis cluster集群搭建(redis 5.0)

这里说一下redis5.0 之后,集群搭建变的简单许多,直接可以通过redis-cli 搭建集群

配置文件说明:

# redis后台运行

daemonize yes

# 绑定的主机端口

bind 127.0.0.1

# 数据存放目录

dir /usr/local/redis-cluster/data/redis-6379

# 进程文件

pidfile /var/run/redis-cluster/${自定义}.pid

# 日志文件

logfile /usr/local/redis-cluster/log/${自定义}.log

# 端口号

port 6379

# 开启集群模式,把注释#去掉

cluster-enabled yes

# 集群的配置,配置文件首次启动自动生成

cluster-config-file /usr/local/redis-cluster/conf/${自定义}.conf

# 请求超时,设置15秒

cluster-node-timeout 15000

# aof日志开启,有需要就开启,它会每次写操作都记录一条日志

appendonly yes

redis cluster集群,要求至少3个master,每个master建议至少给一个slave

正式环境下建议都是在6台机器上去搭建,至少3台机器

保证,每个master都跟自己的slave不在同一台机器上

1) 配置redis

1、首先正常安装一个redis

[root@localhost ~]# tar zxf redis-5.0.5.tar.gz

[root@localhost  ~]# cd redis-5.0.5

[root@localhost  redis-3.2.3]# make&& make install

[root@localhost  redis-3.2.3]# cd utils/

[root@localhost  utils]# ./install_server.sh

#按照默认位置即可(回车下去就好)

2、修改主配置文件

#cp /etc/redis/6379.conf   /etc/redis/redis.conf

#vim /etc/redis/redis.conf

daemonize yes

port 7000

cluster-enabled yes

cluster-config-file nodes-7000.conf . //这个编号最好是等于你的端口号

cluster-node-timeout 15000

appendonly yes

3、用6份配置文件启动6个实例

#mkdir -p /redis/{7000,7001,7002,7003,7004,7005}

#cp /etc/redis/redis.conf /redis/7000/

#cp /etc/redis/redis.conf /redis/7001/

#cp /etc/redis/redis.conf /redis/7002/

#cp /etc/redis/redis.conf /redis/7003/

#cp /etc/redis/redis.conf /redis/7004/

#cp /etc/redis/redis.conf /redis/7005/

4、分别修改6个配置文件

#vim  /redis/7001/redis.conf

port 7001

cluster-config-file nodes-7001.conf .

#vim  /redis/7002/redis.conf

port 7002

cluster-config-file nodes-7002.conf .

#vim  /redis/7003/redis.conf

port 7003

cluster-config-file nodes-7003.conf .

#vim  /redis/7004/redis.conf

port 7004

cluster-config-file nodes-7004.conf

#vim  /redis/7005/redis.conf

port 7005

cluster-config-file nodes-7005.conf

5、启动服务

#redis-server  /redis/7000/redis.conf

#redis-server  /redis/7001/redis.conf

#redis-server  /redis/7002/redis.conf

#redis-server  /redis/7003/redis.conf

#redis-server  /redis/7004/redis.conf

#redis-server  /redis/7005/redis.conf

启动后查看是否启动成功

#netstat -anput | grep redis

2) 集群配置

redis-cli --cluster create 127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005  --cluster-replicas 1

登录集群验证即可:

127.0.0.1:7000> CLUSTER NODES

3.redis cluster通过master水平扩容,来提高吞吐量

1) 创建新的redis

两个: 一个做master 一个做 slave

创建配置文件:

#mkdir -p /redis/{7006,7007}

#cp /etc/redis/redis.conf /redis/7006/

#cp /etc/redis/redis.conf /redis/7007/

#vim  /redis/7006/redis.conf

port 7006

cluster-config-file nodes-7006.conf .

#vim  /redis/7007/redis.conf

port 7007

cluster-config-file nodes-7007.conf .

启动:

#redis-server  /redis/7006/redis.conf

#redis-server  /redis/7007/redis.conf

2) 配置7006为集群主节点

#redis-cli --cluster add-node 127.0.0.1:7006 127.0.0.1:7000

127.0.0.1:7000 是已经存在节点

加入成功后,集群现在有 7 台机器, 4个master 3 个slave

3) 我们为新节点手工分配hash槽

随便找一台主节点,让它进行重新分片操作

# redis-cli --cluster reshard 127.0.0.1:7000

4) 配置7007加入集群,成为7006的从节点

加入集群:

#redis-cli --cluster add-node 127.0.0.1:7007 127.0.0.1:7000

我们需要执行replicate命令来指定当前节点(从节点)的主节点id为哪个:

首先登录 7007:

# redis-cli -p 7007

查看集群状态(目前应该是5个master,3个slave),记录7006的id:

127.0.0.1:7007> cluster nodes

33206e9384297092b5b8a85c944f3564e5d983d7 127.0.0.1:7000@18003 master - 0 1544885646000 3 connected 10923-16383

60a0f7ced303374d8b36e7aa219cbcd4ff5b0caf 127.0.0.1:7003@18005 slave 662809cf2d5bb138912dea7fb1e452f6e0f149da 0 1544885647000 1 connected

fea53768189af3e3e4849038af13607f59ec84b0 127.0.0.1:7001@18007 master - 0 1544885647003 7 connected 0-999

71404f4e815c2e315926ac788389120f82029958 127.0.0.1:7007@18008 myself,master - 0 1544885643000 0 connected

7b5f6aa6dcb4d5aca4a94e57ddeea6971b38bba6 127.0.0.1:7002@18002 master - 0 1544885646000 2 connected 5461-10922

662809cf2d5bb138912dea7fb1e452f6e0f149da 127.0.0.1:7006@18001 master - 0 1544885648015 1 connected 1000-5460

b0db47b7bbd3694596f293aa522488882e8fe647 127.0.0.1:7004@18004 slave 33206e9384297092b5b8a85c944f3564e5d983d7 0 1544885649022 3 connected

194a31057d2e098483bcd2ad01e1bba6a1af6a7d 127.0.0.1:7005@18006 slave 7b5f6aa6dcb4d5aca4a94e57ddeea6971b38bba6 0 1544885646000 2 connected

配置7007作为7006的从节点:

# CLUSTER REPLICATE  662809cf2d5bb138912dea7fb1e452f6e0f149da

至此,我们扩展redis集群已经实现

这里说一个slave冗余的概念:

就是一个master下挂载两个或多个slave

能更大程度上保证redis集群的可靠性