哨兵
定义:
哨兵(sentinel)是一个分布式系统,用于对主从复制的每一台服务器进行监控,当出现故障投票选出新的master其他slave进行连接。
相关配置
port 26379 (sentinel的端口)
sentinel monitor mymaster 127.0.0.1 6379 2
(mymaster是名字 必须统一,127是master的地址,6379是端口 ,2指的是sentinel为3个的时候2个认为挂掉的了就是挂掉了)
sentinel down-after-millisecands mymaster 3000
sentinel paralled-syncs mymaster 1 (1是挂了后同步越大服务器压力越大)
sentinel failover-time mymaster 18000 (挂了后同步的超时时间)
3个哨兵这个配置文件复制3份修改一下就可以
架构图
哨兵们相互通信 每一个哨兵都监视所有的节点
工作原理
监控阶段
step1. sentinel1连接master
step2.master返回所有slave节点信息
step3.sentinel1 分别连接master下的所有slave
多哨兵都重复之前1-3的步骤
在sentinel1连接后,sentinel2连接的时候会从master中获取master已经连接sentinel1
这时候sentinel1与sentinel2开始通信,发布订阅模式消息共享
通知阶段
保持通信
故障转移
step1.发现异常
step2.竞选sentinel负责人 投票选出
step3.sentinel负责人选取新的master
(在线的,响应快的,原master断开时间短的 slave offset大的都一样选runid小的)
step4.其他slave
连接新的master
故障恢复
故障恢复的时候已经有新的slave担任master 原来挂掉的master变成slave 去连接新上任的master