Redis高级之——Redis的哨兵机制

哨兵机制

主机宕机:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LE1csiwD-1596092946462)(C:\Users\栾昊\AppData\Roaming\Typora\typora-user-images\image-20200730091539279.png)]

  • 关闭master和所有slave
  • 找一个slave作为master
  • 修改其他slave的配置,连接新的主
  • 启动新的master与slave
  • 全量复制N+部分复制N (启动成功了,正常,不成功,就要全量复制和部分复制)
  • 谁来确定master宕机了
  • 关闭期间的数据服务谁来承接?
  • 找一个主?怎么找法?
  • 修改配置后,原始的主恢复了怎么办?
简介

哨兵(sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的

master并将所有slave连接到新的master。
在这里插入图片描述

哨兵的作用
  • 监控

    1. 不断的检查master和slave是否正常运行。
    2. master存活检测、master与slave运行情况检测
  • 通知(提醒)

    1. 当被监控的服务器出现问题时,向其他(哨兵间,客户端)发送通知。
  • 自动故障转移

    1. 断开master与slave连接,选取一个slave作为master,将其他slave连接到新的master,并告知客户端新的服务器地址

注意:哨兵也是一台redis服务器,只是不提供数据服务,通常哨兵配置数量为单数

启用哨兵模式
配置哨兵
  • 配置一拖二的主从结构

  • 配置三个哨兵(配置相同,端口不同)

    ​ 参看sentinel.conf

  • 启动哨兵

    redis-sentinel sentinel-端口号.conf
    
配置项范例说明
sentinel auth-pass <服务器名称> sentinel auth-pass mymaster itcast连接服务器口令
sentinel down-after-milliseconds <自定义服务名称><主机地址><端口><主从服务器总量>sentinel monitor mymaster 192.168.194.131 6381 1设置哨兵监听的主服务器信息,最后的参数决定了最终参与选举的服务器 数量(-1)
sentinel down-after-milliseconds <服务名称><毫秒数(整数)>sentinel down-after-milliseconds mymaster 3000指定哨兵在监控Redis服务时,判定服务器挂掉的时间周期,默认30秒 (30000),也是主从切换的启动条件之一
sentinel parallel-syncs <服务名称><服务器数(整数)>sentinel parallel-syncs mymaster 1指定同时进行主从的slave数量,数值越大,要求网络资源越高,要求约小,同步时间约长
sentinel failover-timeout <服务名称><毫秒数(整数)>sentinel failover-timeout mymaster 9000指定出现故障后,故障切换的最大超时时间,超过该值,认定切换失败,默认3分钟
sentinel notification-script <服务名称><脚本路径>服务器无法正常联通时,设定的执行脚本,通常调试使用。

过程:第一步:将sentinel.conf改名sentinel-26379.conf 并移动到conf目录中

在这里插入图片描述

如下图:
在这里插入图片描述

第二步:设置主从节点的conf文件,主文件为redis-6379.conf 从文件为redis-6380.conf 和 redis-6381.conf
在这里插入图片描述

启动顺序:先启动主机,再启动从机,最后启动哨兵

​ 命令操作:

  • 启动主机:

    redis-server redis-6379.conf 
    
  • 启动从机

    redis-server redis-6380.conf
    redis-server redis-6381.conf
    
  • 启动哨兵

    redis-sentinel sentinel-26379.conf
    redis-sentinel sentinel-26380.conf 
    redis-sentinel sentinel-26381.conf 
    

全部启动之后对哨兵客户端输入info发现,(重点在最后一行) 哨兵客户端mymaster,主机是127.0.0.1:6379,有两个从机

和三个哨兵

在这里插入图片描述

当主机宕机之后,哨兵的服务器日志会出现如下图:

​ 通过日志我们可以看到,当主机宕机的时候,服务器日志通知,将master主机移动到了6381上,(可看日志第三行和最后三行 进行对比即可)

在这里插入图片描述

哨兵工作原理
主从切换
  • 哨兵在进行主从切换过程中经历三个阶段

    • 监控:即时刻监控着redis的master和slave进程是否是在正常工作。
    • 通知:就是说当它发现有redis实例有故障的话,就会发送消息给管理员
    • 故障转移:如果redis master 节点宕机了的话,它就会将请求转到slave 节点上,slave升为master。

    充当配置中心,如果发生了故障转移,它会通知将master的新地址写在配置中心告诉客户端

阶段一:监控阶段
  • 用于同步各个节点的状态信息

    • 获取各个sentinel的状态(是否在线)
    • 获取master的状态 (拿到如下信息)
      • master属性
        • runid
        • role:master
      • 各个slave的详细信息
  • 获取所有slave的状态(根据master中的slave信息)

    • slave属性
      • runid
      • role:slave
      • master_host、master_port
      • offset
      • ……

在这里插入图片描述

先启动主从服务器在启动哨兵
1.启动哨兵,连接上master之后发送info指令,获取master的信息
2.哨兵和master之间建立cmd连接方便发送指令,同时在哨兵端保存了所有信息包括master/slaves/sentinels,在master端也保存了所有信息包括master/slaves/sentinels
3.哨兵根据获得的slave信息去连接每一个slave,发送info指令获取slave详细信息
4.启动第二个哨兵也会自动去连接master,发送info指令,会发现master已经和其他哨兵连接过同时建立cmd连接,此时哨兵端保存信息包括master/slave/sentinels(包括之前连接的哨兵),两个哨兵之间也会建立连接。
5.当第三个哨兵启动的时候,也会进行之前的操作

阶段二:通知阶段

在这里插入图片描述

第二阶段是一个信息的长期维护阶段,三个sentinel组成一个小的群体,他们之间进行信息的互通。服务器(master、slave)正常工作。sentinel会时时刻刻通过他们建立的链接去获取他们的信息(hello)【不管是谁获取到都会同步到其他sentinel上】,拿到信息以后他们会在三个sentinel组中进行信息互通,在下一个阶段可能就会是另外一个sentinel拿到信息,然后进行互通

阶段三:故障转移阶段

在这里插入图片描述

1.其中一个sentinel向master发送信息,一段时间内master没有回应,标记状态SRI_S_DOWN(主观下线)
2.sentinel在自己内网中告诉其他哨兵,master挂了。其他哨兵也去连接master,半数以上的哨兵发现master挂了,那就是真的挂了,状态改成SRI_O_DOWN(客观下线)
3.所有的哨兵推选出一个哨兵领导,哨兵根据自己的原则从所有的slave中挑选出新的master,其他slave切换新的master,故障恢复后原master作为slave
在这里插入图片描述

准备清理master,就来到了sentinel他们开始准备参选和投票,当sentinel1有了半票,那么sentinel1就有权力在剩下的slave当中去选一个slave

  • 服务器列表中挑选备选master

    • 在线的
    • 响应慢的 (感觉应该是响应快的,因为slave的速度越快越好)
    • 与原master断开时间久的 (应该是断开不久的,如果断开久了宕机了不知道,就尴尬了)
  • 优先原则

    • 优先级
    • offset
    • runid
  • 发送指令( sentinel )

    • 向新的master发送slaveof no one
    • 向其他slave发送slaveof 新masterIP端口

主从切换总结

  • 监控

    • 同步信息
  • 通知

    • 保持联通
  • 故障转移

    • 发现问题
    • 竞选负责人
    • 优选新master
    • 新master上任,其他slave切换master,原master作为slave故障回复后连接
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值