Redis系列——第七章 Redis开启哨兵模式

最新推荐文章于 2024-08-19 12:56:52 发布

博渊同学

最新推荐文章于 2024-08-19 12:56:52 发布

阅读量1.9k

点赞数 2

分类专栏：缓存 Java 文章标签： redis java 分布式

本文链接：https://blog.csdn.net/weixin_42083036/article/details/113564295

版权

Java 同时被 2 个专栏收录

47 篇文章 3 订阅

订阅专栏

缓存

11 篇文章 0 订阅

订阅专栏

Redis系列

Redis系列——第一章 Redis配置文件

Redis系列——第二章 Redis数据类型以及基本使用

Redis系列——第三章 Redis开启事务并实现乐观锁

Redis系列——第四章 Redis发布订阅模式

Redis系列——第五章 Redis持久化策略RDB与AOF

Redis系列——第六章 Redis主从同步

Redis系列——第七章 Redis开启哨兵模式

文章目录

Redis系列

一、Redis哨兵模式

1、为什么要哨兵模式？

哨兵模式一般出现在主从同步开启，由于从机默认只读不可写的特性，导致了如果主机宕机，整个redis集群都不可用，这是无法容忍的，虽然我们可以手动设置从机升级为主机但是存在时效性，这样会导致数据的丢失，以及整个服务项目的性能。所以为了解决Redis主机宕机问题，Redis想出了哨兵机制。
总结：

为了Redis高可用
自动故障迁移(Automatic failover)

2、什么是哨兵模式？

打仗的时候都会在前线设置哨兵盯着，一旦发现情况不对就立马汇报。Redis的哨兵也是这个作用，不过Redis的哨兵盯住的不是其他，而是主机，Redis的哨兵启动后会一直盯住master主机一旦发现master挂了，会进行一个下线判断，如果判定master下线，那么就会重新在从机中推举一个出来成为新的主机，就算挂了的主机重新启动也只能成为新任老大的小弟。
在这里插入图片描述

3、如何开启

1、创建sentinel.conf文件

在这里插入图片描述

2、内容增加

# sentinel monitor 被监控的主机名(自定义) 被监控的主机IP 被监控的数据库端口号 投票数
# 投票数：表示主机挂掉后，从机投票选举主机，得票数达到多少后成为主机
sentinel monitor myredis 127.0.0.1 6379 1
#如果被监控的主机需要密码  加入sentinel auth-pass 被监控的主机名 密码
#sentinel auth-pass myredis  123

3、使用命令启动

Linux：

redis-sentinel  kconfig/sentinel.conf

Windows：

redis-server.exe sentinel.conf --sentinel

在这里插入图片描述
启动后sentinel.conf文件会增加一些配置

sentinel myid b2c17cf276ce21e73d542f56402cd4998b5c357b
# Generated by CONFIG REWRITE
port 26379
dir "F:\\Redis-x64-3.2.100"
sentinel monitor myredis 127.0.0.1 6379 1
sentinel config-epoch myredis 0
sentinel leader-epoch myredis 2
sentinel current-epoch 2

参数解读

# Example sentinel.conf
 
# 哨兵sentinel实例运行的端口 默认26379
port 26379
 
# 哨兵sentinel的工作目录
dir /tmp
 
# 哨兵sentinel监控的redis主节点的 ip port 
# master-name  可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
# quorum 配置多少个sentinel哨兵统一认为master主节点失联 那么这时客观上认为主节点失联了
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
  sentinel monitor mymaster 127.0.0.1 6379 2
 
# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster MySUPER--secret-0123passw0rd
 
 
# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000
 
# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步，
这个数字越小，完成failover所需的时间就越长，
但是如果这个数字越大，就意味着越 多的slave因为replication而不可用。
可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1
 
 
 
# 故障转移的超时时间 failover-timeout 可以用在以下这些方面： 
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。  
#4.当进行failover时，配置所有slaves指向新的master所需的最大时间。不过，即使过了这个超时，slaves依然会被正确配置为指向master，但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout <master-name> <milliseconds>
sentinel failover-timeout mymaster 180000
 
# SCRIPTS EXECUTION
 
#配置当某一事件发生时所需要执行的脚本，可以通过脚本来通知管理员，例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则：
#若脚本执行后返回1，那么该脚本稍后将会被再次执行，重复次数目前默认为10
#若脚本执行后返回2，或者比2更高的一个返回值，脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了，则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s，如果超过这个时间，脚本将会被一个SIGKILL信号终止，之后重新执行。
 
#通知型脚本:当sentinel有任何警告级别的事件发生时（比如说redis实例的主观失效和客观失效等等），将会去调用这个脚本，
这时这个脚本应该通过邮件，SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时，将传给脚本两个参数，
一个是事件的类型，
一个是事件的描述。
如果sentinel.conf配置文件中配置了这个脚本路径，那么必须保证这个脚本存在于这个路径，并且是可执行的，否则sentinel无法正常启动成功。
#通知脚本
# sentinel notification-script <master-name> <script-path>
  sentinel notification-script mymaster /var/redis/notify.sh
 
# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时，这个脚本将会被调用，通知相关的客户端关于master地址已经发生改变的信息。
# 以下参数将会在调用脚本时传给脚本:
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
# 目前<state>总是“failover”,
# <role>是“leader”或者“observer”中的一个。 
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的，能被多次调用，不是针对性的。
# sentinel client-reconfig-script <master-name> <script-path>
 sentinel client-reconfig-script mymaster /var/redis/reconfig.sh

4、连接sentinel的客户端查看信息

Windows 打开redis的目录进入命令行执行下面命令

redis-cli.exe -p 26379 
sentinel masters

在这里插入图片描述

4、哨兵的集群配置

同开启步骤类似，需要多少个哨兵就创建多少份.conf文件，但是注意文件名不要重复推荐使用端口名命名

5、哨兵模式的整个过程

1、流程图

在这里插入图片描述

2、流程分析

每个Sentinel以每秒钟一次的频率向它所知的Master，Slave以及其他 Sentinel 实例发送一个PING命令。
如果一个实例（instance）距离最后一次有效回复PING命令的时间超过 own-after-milliseconds选项所指定的值，则这个实例会被Sentinel标记为主观下线。
如果一个Master被标记为主观下线，则正在监视这个Master的所有 Sentinel要以每秒一次的频率确认Master的确进入了主观下线状态。
当有足够数量的Sentinel（大于等于配置文件指定的值）在指定的时间范围内确认Master的确进入了主观下线状态，则Master会被标记为客观下线。
在一般情况下，每个Sentinel 会以每10秒一次的频率向它已知的所有Master，Slave发送 INFO 命令。
当Master被Sentinel标记为客观下线时，Sentinel 向下线的 Master 的所有Slave发送INFO命令的频率会从10秒一次改为每秒一次。
若没有足够数量的Sentinel同意Master已经下线，Master的客观下线状态就会被移除。若Master重新向Sentinel 的PING命令返回有效回复，Master的主观下线状态就会被移除。

3、下线类别分析

主观下线
所谓主观下线（Subjectively Down，简称 SDOWN）指的是单个Sentinel实例对服务器做出的下线判断，即单个sentinel认为某个服务下线（有可能是接收不到订阅，之间的网络不通等等原因）。
主观下线就是说如果服务器在down-after-milliseconds给定的毫秒数之内，没有返回 Sentinel 发送的 PING 命令的回复，或者返回一个错误，那么 Sentinel 将这个服务器标记为主观下线（SDOWN ）。
sentinel会以每秒一次的频率向所有与其建立了命令连接的实例（master，从服务，其他sentinel）发ping命令，通过判断ping回复是有效回复，还是无效回复来判断实例时候在线（对该sentinel来说是“主观在线”）。
sentinel配置文件中的down-after-milliseconds设置了判断主观下线的时间长度，如果实例在down-after-milliseconds毫秒内，返回的都是无效回复，那么sentinel回认为该实例已（主观）下线，修改其flags状态为SRI_S_DOWN。如果多个sentinel监视一个服务，有可能存在多个sentinel的down-after-milliseconds配置不同，这个在实际生产中要注意。
客观下线
客观下线（Objectively Down，简称 ODOWN）指的是多个 Sentinel 实例在对同一个服务器做出 SDOWN 判断，并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后，得出的服务器下线判断，然后开启failover。
客观下线就是说只有在足够数量的 Sentinel 都将一个服务器标记为主观下线之后，服务器才会被标记为客观下线（ODOWN）。
只有当master被认定为客观下线时，才会发生故障迁移。
当sentinel监视的某个服务主观下线后，sentinel会询问其它监视该服务的sentinel，看它们是否也认为该服务主观下线，接收到足够数量（这个值可以配置）的sentinel判断为主观下线，既任务该服务客观下线，并对其做故障转移操作。
sentinel通过发送 SENTINEL is-master-down-by-addr ip port current_epoch runid，（ip：主观下线的服务id，port：主观下线的服务端口，current_epoch：sentinel的纪元，runid：*表示检测服务下线状态，如果是sentinel 运行id，表示用来选举领头sentinel）来询问其它sentinel是否同意服务下线。
一个sentinel接收另一个sentinel发来的is-master-down-by-addr后，提取参数，根据ip和端口，检测该服务时候在该sentinel主观下线，并且回复is-master-down-by-addr，回复包含三个参数：down_state（1表示已下线，0表示未下线），leader_runid（领头sentinal id），leader_epoch（领头sentinel纪元）。
sentinel接收到回复后，根据配置设置的下线最小数量，达到这个值，既认为该服务客观下线。
客观下线条件只适用于主服务器：对于任何其他类型的 Redis 实例， Sentinel 在将它们判断为下线前不需要进行协商，所以从服务器或者其他 Sentinel 永远不会达到客观下线条件。只要一个 Sentinel 发现某个主服务器进入了客观下线状态，这个 Sentinel 就可能会被其他 Sentinel 推选出，并对失效的主服务器执行自动故障迁移操作。