Redis的哨兵机制是官方推荐的一种高可用(HA)方案,我们在使用Redis的主从结构时,如果主节点挂掉,这时是不能自动进行主备切换和通知客户端主节点下线的。
Redis-Sentinel机制主要用三个功能:
(1)监控:不停监控Redis主从节点是否安装预期运行
(2)提醒:如果Redis运行出现问题可以 按照配置文件中的配置项 通知客户端或者集群管理员
(3)自动故障转移:当主节点下线之后,哨兵可以从主节点的多个从节点中选出一个为主节点,并更新配置文件和其他从节点的主节点信息。
这里先把哨兵机制的配置文件sentinel.conf中的各个配置项先说一下,下一篇文章会好好研究研究这一高可用方案
- # Example sentinel.conf
- # 哨兵sentinel实例运行的端口 默认26379
- port 26379
- # 哨兵sentinel的工作目录
- dir /tmp
- # 哨兵sentinel监控的redis主节点的 ip port
- # master-name 可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
- # quorum 当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了
- # sentinel monitor <master-name> <ip> <redis-port> <quorum>
- sentinel monitor mymaster 127.0.0.1 6379 2
- # 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
- # 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
- # sentinel auth-pass <master-name> <password>
- sentinel auth-pass mymaster MySUPER--secret-0123passw0rd
- # 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
- # sentinel down-after-milliseconds <master-name> <milliseconds>
- sentinel down-after-milliseconds mymaster 30000
- # 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,
- 这个数字越小,完成failover所需的时间就越长,
- 但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。
- 可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
- # sentinel parallel-syncs <master-name> <numslaves>
- sentinel parallel-syncs mymaster 1
- # 故障转移的超时时间 failover-timeout 可以用在以下这些方面:
- #1. 同一个sentinel对同一个master两次failover之间的间隔时间。
- #2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
- #3.当想要取消一个正在进行的failover所需要的时间。
- #4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
- # 默认三分钟
- # sentinel failover-timeout <master-name> <milliseconds>
- sentinel failover-timeout mymaster 180000
- # SCRIPTS EXECUTION
- #配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
- #对于脚本的运行结果有以下规则:
- #若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
- #若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
- #如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
- #一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。
- #通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,
- 这时这个脚本应该通过邮件,SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,
- 一个是事件的类型,
- 一个是事件的描述。
- 如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。
- #通知脚本
- # sentinel notification-script <master-name> <script-path>
- sentinel notification-script mymaster /var/redis/notify.sh
- # 客户端重新配置主节点参数脚本
- # 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
- # 以下参数将会在调用脚本时传给脚本:
- # <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
- # 目前<state>总是“failover”,
- # <role>是“leader”或者“observer”中的一个。
- # 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
- # 这个脚本应该是通用的,能被多次调用,不是针对性的。
- # sentinel client-reconfig-script <master-name> <script-path>
- sentinel client-reconfig-script mymaster /var/redis/reconfig.sh