概述
在实际使用过程中,若master宕机,如何选择一个新的master?
如果选择第一个slave:
- 将宕机的master下线
- 找一个slave作为master
- 通知所有的slave连接新的master
- 启动新的master与slave
- 全量复制*N+部分复制*N
出现的问题:
- 谁来确认master宕机了?
- 找一个master?怎么找法?
- 修改配置后,原始的主恢复了怎么办?
通过一双眼睛盯着他们干活,当除了问题时由他来处理 --- 哨兵
哨兵:哨兵(sentinel)是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的master并将所有slave连接到新的master。
- 监控
- 不断的检查master和slave是否正常运行。
- master存活检测、master与slave运行情况检测
- 通知(提醒)
- 当被监控的服务器出现问题时,向其他(哨兵间,客户端)发送通知。
- 自动故障转移
- 断开master与slave连接,选取一个slave作为master,将其他slave连接到新的master,并告知客户端新的服务器地址
注意:哨兵也是一台redis服务器,只是不提供数据服务,通常哨兵配置数量为单数(防治投票大屏)
启用哨兵模式
- 配置一拖二的主从结构
- 配置三个哨兵(配置相同,端口不同)参看sentinel.conf
- 启动哨兵:redis-sentinel sentinel-端口号.conf
准备工作:
port:端口,默认26379
dir:哨兵的工作信息存储位置
sentinal monitor mymaster(自定义名称) 12.0.0.1 6379(监控的主机是谁) 2(如果有2个哨兵都认为master挂了,那么就认为他挂了,通常设置为哨兵个数一半+1)
sentinel down-after-mil