哨兵模式
哨兵
哨兵简介
主机“宕机”
哨兵
哨兵(sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的 master 并将所有 slave 连接到新的 master。
哨兵的作用
监控
- 不断的检查 master 和 slave 是否正常运行。
- master 存活检测、master 与 slave 运行情况检测
通知(提醒)
- 当被监控的服务器出现问题时,向其他(哨兵间,客户端)发送通知。
自动故障转移
- 断开 master 与 slave 连接,选取一个 slave 作为 master,将其他 slave 连接到新的 master,并告知客户端新的服务器地址
注意:
- 哨兵也是一台redis服务器,只是不提供数据服务
- 通常哨兵配置数量为单数
启用哨兵模式
配置哨兵
配置一拖二的主从结构
配置三个哨兵(配置相同,端口不同)
- 参看sentinel.conf
启动哨兵
redis-sentinel sentinel- 端口号 .conf
将上方文件放入配置文件即可
哨兵工作原理
主从切换
哨兵在进行主从切换过程中经历三个阶段
- 监控
- 通知
- 故障转移
阶段一:监控阶段
阶段二:通知阶段
阶段三:故障转移阶段
监控
- 同步信息
通知
- 保持联通
故障转移
- 发现问题
- 竞选负责人
- 优选新master
- 新master上任,其他slave切换master,原 master 作为 slave 故障回复后连接
主从切换总结
服务器列表中挑选备选master
- 在线的
- 响应慢的
- 与原master断开时间久的
- 优先原则
- 优先级
- offset
- runid
集群
集群简介
现状问题
业务发展过程中遇到的峰值瓶颈
redis提供的服务OPS可以达到10万/秒,当前业务OPS已经达到10万/秒
内存单机容量达到256G,当前业务需求内存容量1T
使用集群的方式可以快速解决上述问题
集群架构
集群就是使用网络将若干台计算机联通起来,并提供统一的管理方式,使其对外呈现单机的服务效果
集群作用
- 分散单台服务器的访问压力,实现负载均衡
- 分散单台服务器的存储压力,实现可扩展性
- 降低单台服务器宕机带来的业务灾难
Redis集群结构设计
数据存储设计
增强可扩展性
集群内部通讯设计
cluster集群结构搭建
搭建方式
原生安装(单条命令)
- 配置服务器(3主3从)
- 建立通信(Meet)
- 分槽(Slot)
- 搭建主从(master-slave)
工具安装(批处理)
Cluster配置
添加节点(开启)
cluster-enabled yes|no
cluster配置文件名,该文件属于自动生成,仅用于快速查找文件并查询文件内容
cluster-config-file <filename>
节点服务响应超时时间,用于判定该节点是否下线或切换为从节点
cluster-node-timeout <milliseconds>
master连接的slave最小数量
cluster-migration-barrier <count>
Cluster节点操作命令
查看集群节点信息
cluster nodes
进入一个从节点 redis,切换其主节点
cluster replicate <master-id>
发现一个新节点,新增主节点
cluster meet ip:port
忽略一个没有solt的节点
cluster forget <id>
手动故障转移
cluster failover
redis-trib命令
添加节点
redis-trib.rb add-node
删除节点
redis-trib.rb del-node
重新分片
redis-trib.rb reshard