Redis 主从复制
概念:是指将一台Redis服务器的数据,复制到其他Redis服务器。前者称为主节点(master/leader),后者称为从节点(slave/follower)数据的复制是单向的,只能从主节点复制到从节点。
作用包括:
(1)数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
(2)故障恢复:如果master宕掉了,使用哨兵模式,可以提升一个 slave 作为新的 master,进而实现故障转移,实现高可用
(3)负载均衡:可以轻易地实现横向扩展,实现读写分离,一个 master 用于写,多个 slave 用于分摊读的压力,从而实现高并发
(4)高可用基石:主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础
环境配置
只陪从库不配主库
127.0.0.1:6379> info replication #查看当前库的信息
# Replication
role:master #角色
connected_slaves:0 #没有从机
master_replid:9ca7252693b74260691d05af13461189c0a2fa81
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
复制三个配置文件,修改配置信息
- 端口
- pid名
- log文件名
- dump.rdb名称
[root@xxStudy bin]# ps -ef|grep redis 查看进程看到已经启动了三个redis服务
root 20100 1 0 15:11 ? 00:00:00 redis-server 127.0.0.1:6379
root 20176 1 0 15:12 ? 00:00:00 redis-server 127.0.0.1:6380
root 20254 1 0 15:12 ? 00:00:00 redis-server 127.0.0.1:6381
root 20283 18804 0 15:13 pts/3 00:00:00 grep --color=auto redis
一组二从
默认情况下,每台Redis服务器都是主节点;一般只配置从机即可
一组(79)二从(80,81)
#从机里查看
127.0.0.1:6380> SLAVEOF 127.0.0.1 6379 #slaveof ip port 配置主机
OK
127.0.0.1:6380> info replication
# Replication
role:slave #当前角色为从机
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:7
master_sync_in_progress:0
slave_repl_offset:14
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:9ddaa40fb49125826b4c8297738edb1392588faa
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:14
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:14
#主机中查看
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:1 #比之前多了一个从机的配置
slave0:ip=127.0.0.1,port=6380,state=online,offset=42,lag=0
master_replid:9ddaa40fb49125826b4c8297738edb1392588faa
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:42
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:42
两台都配置完后再查看
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=6380,state=online,offset=280,lag=0
slave1:ip=127.0.0.1,port=6381,state=online,offset=280,lag=1
master_replid:9ddaa40fb49125826b4c8297738edb1392588faa
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:280
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:280
注意
主机可以写,但从机不能写只能读!主机中所有信息和数据都会被从机保存
127.0.0.1:6380> set k2 v2 #从机不能写!
(error) READONLY You can't write against a read only replica.
主机断开连接,从机依旧连接到主机,主机回来之后写操作之后从机依旧可以读取到主机写的数据
从机若断开连接之后查看信息如下:变为了主机不在是79的从机(因为是命令进行配置的,断开连接后命令即失效了,再次配置即可访问主机写的所有数据)
127.0.0.1:6381> info replication
# Replication
role:master
connected_slaves:0
master_replid:397de3fe9c19b7387559340999877c12edbf9471
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
全量复制
用于初次复制或其它无法进行部分复制的情况,将主节点中的所有数据都发送给从节点。
部分复制
用于处理在主从复制中因网络闪退等原因造成数据丢失场景,当从节点再次连上主节点,如果条件允许,主节点会补发丢失数据给从节点,因为补发的数据远远小于全量数据,可以有效避免全量复制的过高开销。但需要注意,如果网络中断时间过长,造成主节点没有能够完整地保存中断期间执行的写命令,则无法进行部分复制,仍使用全量复制 。
主要重新连接master,全量复制将被自动执行
如果主机断开连接可以使用 slaveof no one 让自己变成主节点
哨兵模式
当主机发送宕机时,将自动切换主从关系。可以监控主机是否有故障
哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。
配置多个哨兵,防止单个哨兵出现意外
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线。
测试
- 配置哨兵配置文件sentinel.config
#sentinel monitor 被监控主机名 地址 端口 1
sentinel monitor myredis 127.0.0.1 6379 1 #后面数字1代表主机出错之后,slave投票,票数最高的接替主机
- 启动哨兵
#redis-sentinel xqjconfig/sentinel.config 启动哨兵模式
[root@xxStudy bin]# redis-sentinel xqjconfig/sentinel.config
12259:X 23 Jan 2022 08:50:12.538 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
12259:X 23 Jan 2022 08:50:12.538 # Redis version=6.0.6, bits=64, commit=00000000, modified=0, pid=12259, just started
12259:X 23 Jan 2022 08:50:12.538 # Configuration loaded
_._
_.-``__ ''-._
_.-`` `. `_. ''-._ Redis 6.0.6 (00000000/0) 64 bit
.-`` .-```. ```\/ _.,_ ''-._
( ' , .-` | `, ) Running in sentinel mode
|`-._`-...-` __...-.``-._|'` _.-'| Port: 26379
| `-._ `._ / _.-' | PID: 12259
`-._ `-._ `-./ _.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' | http://redis.io
`-._ `-._`-.__.-'_.-' _.-'
|`-._`-._ `-.__.-' _.-'_.-'|
| `-._`-._ _.-'_.-' |
`-._ `-._`-.__.-'_.-' _.-'
`-._ `-.__.-' _.-'
`-._ _.-'
`-.__.-'
12259:X 23 Jan 2022 08:50:12.542 # Sentinel ID is ccd6b50cec9f3579f15fac4be2110945fb0a14d1
12259:X 23 Jan 2022 08:50:12.542 # +monitor master myredis 127.0.0.1 6379 quorum 1
12259:X 23 Jan 2022 08:50:12.543 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:50:12.546 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
如果期间主机master被关闭或者宕机,哨兵会投票选举新的主机
哨兵日志:
12259:X 23 Jan 2022 08:52:12.298 # +sdown master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.298 # +odown master myredis 127.0.0.1 6379 #quorum 1/1
12259:X 23 Jan 2022 08:52:12.299 # +new-epoch 1
12259:X 23 Jan 2022 08:52:12.299 # +try-failover master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.302 # +vote-for-leader ccd6b50cec9f3579f15fac4be2110945fb0a14d1 1
12259:X 23 Jan 2022 08:52:12.302 # +elected-leader master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.302 # +failover-state-select-slave master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.357 # +selected-slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.357 * +failover-state-send-slaveof-noone slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.457 * +failover-state-wait-promotion slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.709 # +promoted-slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.709 # +failover-state-reconf-slaves master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:12.760 * +slave-reconf-sent slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:13.777 * +slave-reconf-inprog slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:13.777 * +slave-reconf-done slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:13.843 # +failover-end master myredis 127.0.0.1 6379
12259:X 23 Jan 2022 08:52:13.843 # +switch-master myredis 127.0.0.1 6379 127.0.0.1 6380
12259:X 23 Jan 2022 08:52:13.843 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6380
12259:X 23 Jan 2022 08:52:13.843 * +slave slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6380
12259:X 23 Jan 2022 08:52:43.895 # +sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6380 #
如果原本的主机连接回来了,只能归并到新的主机下当做从机。
优缺点
优点:
- 哨兵集群,基于主从复制,主从复制的优点它都有
- 主从可以切换,故障可转移吗,可用性高
- 哨兵模式是主从模式的升级,从手动到自动
缺点:
- Redis不好在线扩容,集群容量一旦到达上限,在线扩容就会很麻烦
- 哨兵模式的配置特别多,相对比较麻烦
哨兵模式的全部配置
# 哨兵sentinel实例运行的端口,默认26379
port 26379
# 哨兵sentinel的工作目录
dir ./
# 是否开启保护模式,默认开启。
protected-mode:no
# 是否设置为后台启动。
daemonize:yes
# 哨兵sentinel的日志文件
logfile:./sentinel.log
# 哨兵sentinel监控的redis主节点的
## ip:主机ip地址
## port:哨兵端口号
## master-name:可以自己命名的主节点名字(只能由字母A-z、数字0-9 、这三个字符".-_"组成。)
## quorum:当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了
# sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 127.0.0.1 6379 2
# 当在Redis实例中开启了requirepass,所有连接Redis实例的客户端都要提供密码。
# sentinel auth-pass <master-name> <password>
sentinel auth-pass mymaster 123456
# 指定主节点应答哨兵sentinel的最大时间间隔,超过这个时间,哨兵主观上认为主节点下线,默认30秒
# sentinel down-after-milliseconds <master-name> <milliseconds>
sentinel down-after-milliseconds mymaster 30000
# 指定了在发生failover主备切换时,最多可以有多少个slave同时对新的master进行同步。这个数字越小,完成failover所需的时间就越长;反之,但是如果这个数字越大,就意味着越多的slave因为replication而不可用。可以通过将这个值设为1,来保证每次只有一个slave,处于不能处理命令请求的状态。
# sentinel parallel-syncs <master-name> <numslaves>
sentinel parallel-syncs mymaster 1
# 故障转移的超时时间failover-timeout,默认三分钟,可以用在以下这些方面:
## 1. 同一个sentinel对同一个master两次failover之间的间隔时间。
## 2. 当一个slave从一个错误的master那里同步数据时开始,直到slave被纠正为从正确的master那里同步数据时结束。
## 3. 当想要取消一个正在进行的failover时所需要的时间。
## 4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时,slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来同步数据了
# sentinel failover-timeout <master-name> <milliseconds>
sentinel failover-timeout mymaster 180000
# 当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本。一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。
# 对于脚本的运行结果有以下规则:
## 1. 若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10。
## 2. 若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
## 3. 如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
# sentinel notification-script <master-name> <script-path>
sentinel notification-script mymaster /var/redis/notify.sh
# 这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentinel client-reconfig-script <master-name> <script-path>
sentinel client-reconfig-script mymaster /var/redis/reconfig.sh