Redis哨兵模式

一、概念

哨兵模式本质上为主从复制模式的升级版本。在主从模式中,当master主服务器宕机后,slave从服务器无法自动切换成主服务器,因此引入哨兵(Sentinel)。使用一个或者多个哨兵(Sentinel)实例,对redis节点进行监控,在主节点出现故障后,能够将一个从节点升级为主节点,进行故障转移,保证系统可用性。

Redis的Sentinel系统用于管理多个Redis服务器,该系统具有以下功能:

  • 监控(Monitoring): 不断地检查主从节点实例是否按照预期正常运行工作。
  • 通知(Notification): 通过API通知系统或其他客户端程序,被监控的Redis实例其中一个发生故障。
  • 自动故障转移(Automatic failover): 若master主节点无法正常运行,开始故障转移进程,将从节点升级为主节点,其余从节点重新配置使用新的主节点,并告知使用redis的程序在连接时使用新的地址。
  • 配置提供者(Configuration provider): 当客户端连接到哨兵,会询问当前Redis主服务器的地址。若发生故障转移,哨兵会汇报新地址

 

二、架构

                                      

整体架构由两部分组成,哨兵节点和数据节点:

  • 哨兵节点:哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的redis节点,不存储数据。
  • 数据节点:指主节点和从节点。

 

三、搭建哨兵模式

由于哨兵模式是基于主从模式的升级,所以作为存储的主从节点部署不再赘述,和普通主从节点配置一致,详看《Redis主从复制》。这里主要分析哨兵节点配置。

配置文件sentinel.conf:

#配置端口
port 26379
#以守护进程模式启动
daemonize yes
#日志文件名
logfile "sentinel_26379.log"
#存放备份文件以及日志等文件的目录
dir "/opt/redis/data"
#监控的IP 端口号 名称 sentinel通过投票后认为mater宕机的数量,此处至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移。
sentinel monitor mymaster 192.168.0.1 6379 2
#30秒ping不通主节点的信息,主观认为master宕机
sentinel down-after-milliseconds mymaster 30000
#故障转移后重新主从复制,1表示串行,>1并行
sentinel parallel-syncs mymaster 1
#故障转移开始,三分钟内没有完成,则认为转移失败
sentinel failover-timeout mymaster 180000
#如果redis服务器配置密码连接的话,需要设置密码
sentinel auth-pass mymaster 123

启动哨兵的两种方式:

  • redis-sentinel sentinel.conf
  • redis-server sentinel.conf --sentinel

 

四、基本原理

1.定时任务:

每个哨兵节点维护了3个定时任务。定时任务的功能分别如下:

  • 通过向主从节点发送info命令获取最新的主从结构。
  • 通过发布订阅功能获取其他哨兵节点的信息。
  • 通过向其他节点发送ping命令进行心跳检测,判断是否下线。

 

2.主观下线:

在心跳检测的定时任务中,如果其他节点超过一定时间没有回复,哨兵节点就会将其进行主观下线。主观下线的意思是一个哨兵节点“主观地”判断下线;与主观下线相对应的是客观下线。

 

3.客观下线:

哨兵节点在对主节点进行主观下线后,会通过sentinel is-master-down-by-addr命令询问其他哨兵节点该主节点的状态;如果判断主节点下线的哨兵数量达到一定数值,则对该主节点进行客观下线。

 

需要特别注意的是,客观下线是主节点才有的概念;如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作。

 

4.选举领导者哨兵节点:

当主节点被判断客观下线以后,各个哨兵节点会进行协商,选举出一个领导者哨兵节点,并由该领导者节点对其进行故障转移操作。

监视该主节点的所有哨兵都有可能被选为领导者,选举使用的算法是Raft算法;Raft算法的基本思路是先到先得:即在一轮选举中,哨兵A向B发送成为领导者的申请,如果B没有同意过其他哨兵,则会同意A成为领导者。选举的具体过程这里不做详细描述,一般来说,哨兵选择的过程很快,谁先完成客观下线,一般就能成为领导者。

(5)故障转移:

选举出的领导者哨兵,开始进行故障转移操作,该操作大体可以分为3个步骤:

  • 在从节点中选择新的主节点:选择的原则是,首先过滤掉不健康的从节点;然后选择优先级最高的从节点(由slave-priority指定);如果优先级无法区分,则选择复制偏移量最大的从节点;如果仍无法区分,则选择runid最小的从节点。
  • 更新主从状态:通过slaveof no one命令,让选出来的从节点成为主节点;并通过slaveof命令让其他节点成为其从节点。
  • 将已经下线的主节点(即6379)设置为新的主节点的从节点,当6379重新上线后,它会成为新的主节点的从节点。

 

通过上述几个关键概念,可以基本了解哨兵的工作原理。为了更形象的说明,下图展示了领导者哨兵节点的日志,包括从节点启动到完成故障转移。

 

五、哨兵节点命令

 

1.基础查询

通过这些命令,可以查询哨兵系统的拓扑结构、节点信息、配置信息等。

  • info sentinel:获取监控的所有主节点的基本信息
  • sentinel masters:获取监控的所有主节点的详细信息
  • sentinel master mymaster:获取监控的主节点mymaster的详细信息
  • sentinel slaves mymaster:获取监控的主节点mymaster的从节点的详细信息
  • sentinel sentinels mymaster:获取监控的主节点mymaster的哨兵节点的详细信息
  • sentinel get-master-addr-by-name mymaster:获取监控的主节点mymaster的地址信息,前文已有介绍
  • sentinel is-master-down-by-addr:哨兵节点之间可以通过该命令询问主节点是否下线,从而对是否客观下线做出判断

 

2.增加/移除主节点的监控

  • sentinel monitor mymaster2:127.0.0.1 16379 2 新增节点
  • sentinel remove mymaster2:取消当前哨兵节点对主节点mymaster2的监控

 

3.强制故障转移

  • sentinel failover mymaster:该命令可以强制对mymaster执行故障转移,即使当前主节点运行完好。

 

六、Java中使用哨兵模式

//连接池配置
JedisPoolConfig jedisPoolConfig = new JedisPoolConfig();
jedisPoolConfig.setMaxTotal(10);
jedisPoolConfig.setMaxIdle(5);
jedisPoolConfig.setMinIdle(5);
//哨兵信息
Set<String> sentinels = new HashSet<String>(Arrays.asList(
    "192.168.11.128:26379",
    "192.168.11.129:26379",
    "192.168.11.130:26379"
));
//创建连接池
//mymaster是我们配置给哨兵的服务名称
//sentinels是哨兵信息
//jedisPoolConfig是连接池配置
//abcdefg是连接Redis服务器的密码
JedisSentinelPool pool = new JedisSentinelPool("mymaster", sentinels, jedisPoolConfig, "abcdefg");
//获取客户端
Jedis jedis = pool.getResource();
//执行两个命令
jedis.set("mykey", "myvalue");
String myvalue = jedis.get("mykey");
//打印信息
System.out.println(myvalue);

 

也可通过配置是写哨兵功能:

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
    xmlns:p="http://www.springframework.org/schema/p"
    xsi:schemaLocation="http://www.springframework.org/schema/beans
    http://www.springframework.org/schema/beans/spring-beans-3.2.xsd">
    <bean id="poolConfig" class="redis.clients.jedis.JedisPoolConfig">
        <!-- 最大空闲数 -->
        <property name="maxIdle" value="50" />
        <!-- 最大连接数 -->
        <property name="maxTotal" value="100" />
        <!-- 最大等待时间 -->
        <property name="maxWaitMillis" value="30000" />
    </bean>
    <!-- jdk序列化器,可保存对象 -->
    <bean id="jdkSerializationRedisSerializer"
        class="org.springframework.data.redis.serializer.JdkSerializationRedisSerializer" />
    <!-- String序列化器 -->
    <bean id="stringRedisSerializer"
        class="org.springframework.data.redis.serializer.StringRedisSerializer" />

    <!-- 哨兵配置 -->
    <bean id="sentinelConfig"
        class="org.springframework.data.redis.connection.RedisSentinelConfiguration">
        <!-- 服务名称 -->
        <property name="master">
            <bean class="org.springframework.data.redis.connection.RedisNode">
                <property name="name" value="mymaster" />
            </bean>
        </property>
        <!-- 哨兵服务IP和端口 -->
        <property name="sentinels">
            <set>
                <bean class="org.springframework.data.redis.connection.RedisNode">
                    <constructor-arg name="host" value="192.168.11.128" />
                    <constructor-arg name="port" value="26379" />
                </bean>
                <bean class="org.springframework.data.redis.connection.RedisNode">
                    <constructor-arg name="host" value="192.168.11.129" />
                    <constructor-arg name="port" value="26379" />
                </bean>
                <bean class="org.springframework.data.redis.connection.RedisNode">
                    <constructor-arg name="host" value="192.168.11.130" />
                    <constructor-arg name="port" value="26379" />
                </bean>
            </set>
        </property>
    </bean>
    <!-- 连接池设置 -->
    <bean id="connectionFectory"
        class="org.springframework.data.redis.connection.jedis.JedisConnectionFactory">
        <constructor-arg name="sentinelConfig" ref="sentinelConfig" />
        <constructor-arg name="poolConfig" ref="poolConfig" />
        <property name="password" value="abcdefg" />
    </bean>
    <!-- 配置 RedisTemplate -->
    <bean id="redisTemplate" class="org.springframework.data.redis.core.RedisTemplate">
        <property name="connectionFactory" ref="connectionFactory" />
        <property name="keySerializer" ref="stringRedisSerializer" />
        <property name="defaultSerializer" ref="stringRedisSerializer" />
        <property name="valueSerializer" ref="jdkSerializationRedisSerializer" />
    </bean>
</beans>

其他配置项

配置项参数类型作用
port整数哨兵进程端口
dir文件夹目录哨兵进程服务临时文件夹,默认为/tmp,要保证有可写入的权限
sentinel down-after-milliseconds

<服务名称><毫秒数(整数)>

指定哨兵在监测 Redis 服务时,当 Redis 服务在一个亳秒数内都无 法回答时,单个哨兵认为的主观下线时间,默认为 30000(30秒)
sentinel parallel-syncs

<服务名称><服务器数(整数)>

指定可以有多少 Redis 服务同步新的主机,一般而言,这个数字越 小同步时间就越长,而越大,则对网络资源要求则越高
sentinel failover-timeout

<服务名称><毫秒数(整数)>

指定在故障切换允许的亳秒数,当超过这个亳秒数的时候,就认为切换故障失败,默认为 3 分钟
sentinel notification-script<服务名称><脚本路径>指定 sentinel 检测到该监控的 redis 实例指向的实例异常时,调用的 报警脚本。该配置项可选,比较常用

sentinel down-after-milliseconds 配置项只是一个哨兵在超过其指定的毫秒数依旧没有得到回答消息后,会自己认为主机不可用。对于其他哨兵而言,并不会认为主机不可用。

哨兵会记录这个消息,当拥有认为主观下线的哨兵到达 sentinel monitor 所配置的数量的时候,就会发起一次新的投票,然后切换主机,此时哨兵会重写 Redis 的哨兵配置文件,以适应新场景的需要。

 

七、总结

  • 优点:

  1. 哨兵模式是主从模式的升级版,除了有主从模式的优点,还能实现自动故障转移恢复。
  2. 哨兵之间可以相互进行监控,心跳检测,及时发现系统问题。
  • 缺点:

  1. 哨兵无法对从节点进行自动故障转移。在读写分离场景下,从节点故障会导致读服务不可用。
  2. 无法解决写的负载均衡,若主节点服务器宕机,故障恢复时间较长,写的业务会受到影响。
  3. 哨兵增加系统复杂度,维护成本高。

 

参考资料:

深入学习Redis(4):哨兵

Redis哨兵模式的配置方法及其在Java中的用法

Redis官网文档

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值