一.节点
cluster meet <ip> <port> //向节点握手
cluster nodes //查看集群节点
进行节点握手,握手成够后,node节点会将该节点加入到node节点的集群中。
节点启动:cluster-enabled 为yes则为集群模式启动
节点的数据结构:
struct clusterNode{
//创建节点时间
mstime_t ctime;
//节点的名称,由40个16进制的字符组成
char name[REDIS_CLISTER_NAMELEN]
//节点标识
//使用不同的标识来表示节点的不同角色
//以及标识节点的不同状态
int flags;
//节点当前的配置纪元,用于故障转移
unint64_t configEpoch;
//节点的ip地址
char ip[REDIS_IP_STR_LEN]
//节点的端口号
int port;
//保存连接点的有关信息
clusterLink *link;
};
cluster meet 命令的实现:
- 节点A会给节点B创建一个clusterNode结构,将该结构添加到自己的clusterState.nodes字典里面。
- 之后节点A会根据命令中的地址与端口向节点B发送一个meet消息。
- 如果节点B接受到节点A的消息,会为节点A创建一个clusterNode结构,并将该结构添加到自己的clusterState.nodes中。
- 之后节点B向节点A返回一个pong消息
- 节点A接受到节点B的pong消息,通过pong消息节点A知道自己的meet消息被节点B接受
- 之后节点A向节点B发送一条ping命令
- 节点B接收到节点A的ping命令,通过该命令节点B知道节点A接受到自己的Pong命令。握手完成。
二.槽指派
Redis集群通过分片的方式来保存数据库中的键值对:集群的整个数据库被分为16834个槽,数据库中的每一个键都属于这16834中的一个,集群中的每个节点都能处理0到16834个槽。
当数据库中的16834个槽都有节点处理时,整个集群属于上线状态,有且仅当一个槽没有被节点处理时,该集群属于下线状态。
cluster addslots 0 1 2 3 4 ... 5000 //给该节点分配5000个槽
记录节点中槽的指派信息:
struct clusterNode{
unsinged char slots[16384/8]
int numslots;
}
slots时一个二进制的数组,这个数组的长度时16384/8=2048个字节,共包含16384个二进制位。
一个节点除了会将自己处理的槽记录到自己的cluterNode中,还会将自己的slots数组通过消息发送到集群的其他节点,告诉其他节点自己负责的那些槽。
例如当节点A接受到节点B发送的slots数组时,会在自己的cluterState.nodes中找到节点B的cluterNode结构,并对结构中的slots进行保存或更新。
三.在集群中执行命令
执行命令判断流程:
计算键属于那个槽:
节点使用算法来计算键属于那个在0~16383之间的那个槽。所以从一个方面来说,每个建位的槽都是固定的。
四.AKS错误
在进行重新分片时,源节点在向目标节点迁移的过程中,可能会出现这样一种情况:属于被迁移的一部分键保存在源节点中,而另一部分保存在目标节点中。这时就会返回AKS错误。
五.复制与故障转移
Redis集群中的节点分为主节点和从节点,其中主节点用于处理槽,而从节点则用于复制某个主节点,并在其复制的主节点下线时,代替主节点继续处理命令请求。
故障检测:如果在集群中半数以上负责处理槽的主节点都将某个主节点标记为疑似下线。那么这个主节点就会被标记为已下线,将主节点标记为已下线的节点会向集群广播一条该节点已下线的消息。收到该消息的主节点会将该节点标记为已下线。
故障转移:
- 复制主节点中的所有到从节点里面,会有一个从节点被选中。
- 被选中的从节点会执行SLAVEOF on one命令,成为主节点。
- 新的主节点会撤销所有已下线主节点的槽指派,并将这些槽指派给自己。
- 新的主节点会在集群中广播一个PONG命令,告诉其他的主节点这个节点已经变为主节点,并也继承了该下线节点的所有的槽。
六.消息
集群中各个节点通过messgae来进行通信,发送消息的节点被称位sender,接受消息的节点被称位receiver.
消息分为五种:
- MEET消息:当发送者接收到客户端的CLUSTER MEET命令时,发送者会向接收者发送meet消息,请求接收者加入到当前的集权中。
- PING消息:集群中的每个节点默认每隔一秒就会从已知节点中选出5个。然后对这五个节点中最长时间没有发送ping消息的节点发送ping节点,以来检测该节点是否在线。
- PONG消息:当节点接受到MEET消息和PING消息时,为了向发送端表示已接受到该消息,会返回一个PONG消息,表示自己已经接受到该消息。
- FAIL消息:当一个主节点A判断另一个主节点B进入FAIL状态时,节点A会在集权中广播一个关于节点B的FAIL的消息,接受到该消息的节点会将节点B更新位FAIL(下线)状态。
- PUBLISH消息:当一个节点接受到PUBLSH消息时,会在集群中广播PUBLSH消息,接受到该消息的节点会执行相同的PUBLISH命令。