解决Redis哨兵集群哨兵之间无法感应问题
集群哨兵无法感应带来的影响
当Redis服务集群中的Master节点宕机的时候,Redis自动无法进行主从切换。
Reis集群内容
一个Master、两个Slave、三个Sentinel。
sentinel相关的主从切换配置信息也是正确的。
问题根源
问题根源很有可能是:你的哨兵配置文件中,用于标识哨兵唯一性的myid是不是重复的?
反思
回想起来自己配置哨兵的步骤:
- 配置出26379哨兵;
- 启动了26379哨兵服务;
- 开始配置26380哨兵,配置文件的时候直接是:cp sentinel-26379.conf sentinel-26380.conf
- 开始配置26381哨兵,配置文件的时候直接是:cp sentinel-26379.conf sentinel-26381.conf
- …
后面的步骤就不写了,从上面三个步骤中已经发现问题了,第三步直接是copy哨兵26379的配置文件。 如果26379哨兵没有启动服务过,你这样copy是没有问题的,因为26379还没有生成myid;而你偏偏让26379先启动,然后再去配置26380哨兵,这时候你是连26379的myid一起copy过去的,然后你最后还没有把myid删掉,这就造成三个哨兵的myid都是一样的。
哨兵主从切换
那么哨兵节点直接是如何自动发现的呢,或者说从哪里可以体现出来哨兵节点之间的自动发现呢?
既然会自动识别,因此就怀疑,哨兵节点启动之后,会将自动将这些信息记录到配置文件中去,试了一把,果不其然。
如下是在Redis主从复制的基础上,依次启用三个哨兵节点的后,sentinel.cnf的变化情况
可以发现,当启用了三个哨兵节点之后,sentinel.cnf配置文件会被自动重写,主要有一下几点:
- 增加了一个sentinel myid (标识哨兵节点的唯一性)
- 自动追加哨兵节点本身的信息(这样哨兵节点之间就会相互自动发现),以及redis数据服务的slave的信息
- 自动移除主节点的密码
- dir 的相对路径被修改为绝对路径
可见,Redis的哨兵不仅是Redis自动故障转义,而且实现了哨兵节点自己的高可用。同时对于密码之类的信息,也是在哨兵节点初始化之后自动移除。
myid介绍
哨兵的myid是当哨兵启动服务的时候,redis自动生成的,且生成位置在配置文件的末尾: