哨兵(sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的master并将所有slave连接到新的master。
将宕机的master下线
找一个slave作为master
通知所有的slave连接新的master
启动新的master与slave
全量复制*N+部分复制 *N
哨兵作用:
监控:不断的检查master和slave是否正常运行。
master存活检测、master与slave运行情况检测
通知(提醒):当被监控的服务器出现问题时,向其他(哨兵间,客户端)发送通知。
自动故障转移:断开master与slave连接,选取一个slave作为master,将其他slave连接到新的master,并告知客户端新的服务器地址。
注意:
哨兵也是一台redis服务器,只是不提供数据服务
通常哨兵配置数量为单数
配置哨兵:
配置一拖二的主从结构
配置三个哨兵(配置相同,端口不同)
参看sentinel.conf
启动哨兵
redis-sentinel sentinel-端口号.conf
工作原理:
主从切换
哨兵在进行主从切换过程中经历三个阶段
监控
通知
故障转移
监控阶段:
监控 ——>同步信息
通知——>保持联通
故障转移
发现故障->竞选哨兵负责人->选新master->新master上任,其他slave切换master,原master作为slave故障恢复后连接。
集群架构
集群就是使用网络将若干台计算机联通起来,并提供统一的管理方式,使其对外呈现单机的服务效果。
集群作用:
Redis集群结构设计
集群内部通讯设计
Cluster配置
添加节点
cluster-enabled yes|no
cluster配置文件名,该文件属于自动生成,仅用于快速查找文件并查询文件内容
cluster-config-file <filename>
节点服务响应超时时间,用于判定该节点是否下线或切换为从节点
cluster-node-timeout <milliseconds>
master连接的slave最小数量
cluster-migration-barrier <count>
Cluster节点操作命令
查看集群节点信息
cluster nodes
进入一个从节点 redis,切换其主节点
cluster replicate <master-id>
发现一个新节点,新增主节点
cluster meet ip:port
忽略一个没有solt的节点
cluster forget <id>
手动故障转移
cluster failover
redis-trib命令
添加节点
redis-trib.rb add-node
删除节点
redis-trib.rb del-node
重新分片
redis-trib.rb reshard