哨兵模式
(自动选举老大的模式)
概述
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。
谋权篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票自动将从库转换为主库。
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,他会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例
下面是单机哨兵的模型图
这里的哨兵有两个作用
- 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
- 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
假设主服务器宕机,哨兵1先检测到这个结果,系统不会马上进行failove[故障转移]过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象称为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果有一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主服务器,这个过程称为客观下线。
怎么开启哨兵模式
目前是在一主二从的基础上配置哨兵模式
1、配置哨兵配置文件
#sentinel monitor 被监控的名称 host port 1
sentinel monitor myredis 127.0.0.1 6379 1
后面的 数字1,代表主机挂了,slave投票看让谁接替成为主机,票数最多的,就会成为主机!
2、启动哨兵
[root@localhost bin]# redis-sentinel kconfig/sentinel.conf
61977:X 21 Jul 2020 11:24:13.143 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
61977:X 21 Jul 2020 11:24:13.143 # Redis version=6.0.5, bits=64, commit=00000000, modified=0, pid=61977, just started
61977:X 21 Jul 2020 11:24:13.143 # Configuration loaded
61977:X 21 Jul 2020 11:24:13.144 * Increased maximum number of open files to 10032 (it was originally set to 1024).
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 6.0.5 (00000000/0) 64 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 26379
| `-._ `._ / _.-' | PID: 61977
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | http://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
61977:X 21 Jul 2020 11:24:13.145 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
61977:X 21 Jul 2020 11:24:13.145 # Sentinel ID is fe885194af3527c0eb748c5cf26d8f9d90c3e315
61977:X 21 Jul 2020 11:24:13.145 # +monitor master myredis 127.0.0.1 6379 quorum 1
3、测试
我们把主机 shutdown
127.0.0.1:6379> SHUTDOWN
not connected> exit
稍等一会后哨兵发现了,开始故障转移。随机选取
61977:X 21 Jul 2020 11:24:13.143 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
61977:X 21 Jul 2020 11:24:13.143 # Redis version=6.0.5, bits=64, commit=00000000, modified=0, pid=61977, just started
61977:X 21 Jul 2020 11:24:13.143 # Configuration loaded
61977:X 21 Jul 2020 11:24:13.144 * Increased maximum number of open files to 10032 (it was originally set to 1024).
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 6.0.5 (00000000/0) 64 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 26379
| `-._ `._ / _.-' | PID: 61977
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | http://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
61977:X 21 Jul 2020 11:24:13.145 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
61977:X 21 Jul 2020 11:24:13.145 # Sentinel ID is fe885194af3527c0eb748c5cf26d8f9d90c3e315
61977:X 21 Jul 2020 11:24:13.145 # +monitor master myredis 127.0.0.1 6379 quorum 1
61977:X 21 Jul 2020 11:26:57.206 # +sdown master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.206 # +odown master myredis 127.0.0.1 6379 #quorum 1/1
61977:X 21 Jul 2020 11:26:57.206 # +new-epoch 1
61977:X 21 Jul 2020 11:26:57.206 # +try-failover master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.208 # +vote-for-leader fe885194af3527c0eb748c5cf26d8f9d90c3e315 1
61977:X 21 Jul 2020 11:26:57.208 # +elected-leader master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.208 # +failover-state-select-slave master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.271 # +selected-slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
#这里开启故障转移
61977:X 21 Jul 2020 11:26:57.271 * +failover-state-send-slaveof-noone slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.326 * +failover-state-wait-promotion slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.428 # +promoted-slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.428 # +failover-state-reconf-slaves master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.478 * +slave-reconf-sent slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:57.578 * +slave-reconf-inprog slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:58.615 * +slave-reconf-done slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:58.686 # +failover-end master myredis 127.0.0.1 6379
61977:X 21 Jul 2020 11:26:58.686 # +switch-master myredis 127.0.0.1 6379 127.0.0.1 6380
61977:X 21 Jul 2020 11:26:58.686 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
61977:X 21 Jul 2020 11:26:58.686 * +slave slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6380
#+sdown slave 127.0.0.1:6379 挂了
61977:X 21 Jul 2020 11:27:28.758 # +sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6380
我们看一下端口为 6380的从机,发现他已经变成了主机
127.0.0.1:6380> info replication
# Replication
role:master
connected_slaves:1
slave0:ip=127.0.0.1,port=6381,state=online,offset=35887,lag=0
master_replid:1cfb3730d77b61d5e466e3bd0680dc7a4012c4d3
master_replid2:ba86452e653a55307933140b878d224cc5185fd5
master_repl_offset:35887
second_repl_offset:31689
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:281
repl_backlog_histlen:35607
如果主机重新连接,哨兵发现后,会把它归并到新的主机下,当作从机,这就是哨兵模式的规则。
哨兵模式
优点:
1、哨兵集群,基于主从复杂模式,所有的主从配置优点,它全有
2、主从可以却换,故障可以转移,系统的可用性就会更好
3、哨兵模式就是主从复制的升级,手动到自动,更加健壮!
缺点:
1、Redis不好在线扩容的,集群容量一旦达到上限,在线扩容就十分麻烦!
2、实现哨兵模式的配置其实是很麻烦的,里面有很多的选择
哨兵模式全部配置