redis主从复制
主从复制
- 主从复制是redis 高可用的一种保证
- master:提供数据方(写)
- slave:接收数据方(读)
主从复制概念
- 主从复制:将master中的数据同步到slave中
- 特征:
- 一个master可以拥有多个slave,一个slave只能对应一个master
- 职责:master和slave各自的职责不一样
- master:
- 写数据,执行写操作时,将出现变化的数据同步到slave
- 读数据(可以忽略)
- slave:
- 读数据
- 写数据(禁止)
主从复制作用
- 读写分离:master写,slave读,提高服务器的读写负载能力
- 负载均衡:基于主从架构,配合读写分离,由slave分担master负载,并根据需求的变化,改变slave的数量,通过多个节点分担数据读取负载,大大提高redis服务器并发量和数据吞吐量。
- 故障恢复:当master出现问题时,由slave提供服务,实现快速的故障恢复。
- 数据冗余:实现数据热备份,是持久化之外的一种数据冗余方式。
- 高可用基石:基于主从复制,构建哨兵模式与集群,实现redis的高可用方案。
单机redis的风险与问题
结论:
- 为了避免单机redis服务器故障,准备多台服务器,互相连通,将数据复制多个副本保存在不同的服务器上,连接在一起,并保证数据是同步的,即使与一台服务器宕机,其他服务器依然可以继续提供服务,实现redis的高可用,同时实现数据冗余备份。
主从复制-工作流程
(一)建立连接
- 建立slave到master的连接,使master能够识别slave,并保存slave端口号。
主从连接(slave连接master)
master和slave互联:三种方式
注意:在slave客户端设置
- 方式一:slave客户端发送命令
slaveof masterip masterport
- 方式二:slave启动服务器参数
redis-server -slaveof masterip masterport
- 方式三:slave服务器配置文件配置(主流方式)
slaveof masterip masterport
- slave 断开与 master的连接
slaveof no one
授权访问(可以自己动手尝试一下)
建立连接总结
(二)数据同步
- slave初次连接master后,复制master中的所有数据到slave
- 将slave的数据状态更新成master当前的数据库状态
同步过程如下:
1.步骤一:请求同步数据
2.步骤二:创建RDB同步数据
3.步骤三:恢复RDB同步数据
4.步骤四:请求部分同步数据(AOF)
5.步骤五:恢复部分同步数据(AOF)
数据同步工作完成!
当前状态:
- slave:具有master端全部数据,包好RDB过程接受的数据
- master:保存slave当前数据同步的位置
步骤如下:
数据同步阶段master说明
- 1.如果master数据量巨大,数据同步阶段应避开流量高峰期,避免造成master阻塞,影响业务正常执行 。
- 2.复制缓冲区大小设定不合理,会导致数据溢出。如进行全量复制周期太长,进行部分复制时发现数据已 经存在丢失的情况,必须进行第二次全量复制,致使slave陷入死循环状态。
- 3.master单机内存占用主机内存的比例不应过大,建议使用50%-70%的内存,留下50%-30%的内存用于执 行bgsave命令和创建复制缓冲区
# master/redis.conf
# 设置同步缓冲区大小, 根据3)中的百分比建议设置即可
repl-backlog-size ?mb
数据同步阶段slave说明
- 1.为避免slave进行全量复制、部分复制时服务器响应阻塞或数据不同步,建议关闭slave此期间的对外服务。
# slave/redis.conf
# yes,主从复制中,从服务器可以响应客户端请求
# no,主从复制中,从服务器将阻塞所有请求,有客户端请求时返回“SYNC with master in progress”;
slave-serve-stale-data yes|no
- 2.数据同步阶段,master发送给slave信息可以理解成master是slave的一个客户端,注定向slave发送命令。
- 3.多个slave同时对master请求数据同步,master发送的RDB文件增多,会对带宽造成巨大冲击,如果 master带宽不足,因此数据同步需要根据业务需求,适量错峰 。
- 4.slave过多时,建议调整拓扑结构,由一主多从结构变为树状结构,中间的节点既是master,也是 slave。注意:使用树状结构时,由于层级深度,导致深度越高的slave与最顶层master间数据同步延迟 较大,数据一致性变差,应谨慎选择。
(三)命令传播阶段
- 当master数据库状态被修改后,导致主从服务器状态不一致,此时需要让主从数据同步到一致状态,同步的动作称为命令传播。
- master将接受到的数据变更命令发送给slave,slave接收到命令后执行命令。
命令传播阶段的部分复制
- 命令传播阶段出现断网现象
- 网络闪断闪连 忽略
- 短时间网络中断 部分复制
- 长时间网络中断 全量复制
- 部分复制的三个核心要素
- 服务器运行id( run id)
- 主服务器的复制积压缓冲区 – 复制缓冲区
- 主从服务器的复制偏移量 – 复制偏移量
服务器运行ID(runid)
-
概念:服务器运行ID是每一台服务器每次运行的身份识别码,一台服务器多次运行可以生成多个运行id。
-
组成:运行id由40位字符组成,是一个随机的十六进制字符
- 例如:409b6e9ea2e5c32958de8f365711598c98489f13
-
作用:运行id被作用于服务器之间进行传输,识别身份,如果两次操作均对同一台服务器进行,必须每次操作携带对应的运行id,用于对方识别。
-
实现方式:运行id在每台服务器启动时自动生成,master在首次连接slave时,会将自己的运行id发送给slave,slave保存此id,通过info Server命令,可以查看节点的runid.
复制积压缓冲区
- 概念: 复制积压缓冲区,是一个先进先出的队列,用于存储服务器执行过的命令,每次传播命令,master都会将传播的命令记录下来,并储存在复制积压缓冲区。
- 复制缓冲区默认数据存储空间大小是1MB
- 入队元素的数量大于队列长度时,最先入队的元素会被弹出,而新元素会被放入队列
◆ 命令传播阶段,master除了将命令同步给slave外还会在这个缓冲区中备份,而且还会存储每个命令(实际是每个字节)对用的offset值。
原理图如下:
复制积压缓冲区内部工作原理
- 组成
* 偏移量
* 字节值
- 作用
- 通过offset区分不同的slave当前数据传播的差异
- master记录已发送的信息对应的offset
- slave记录已接收的信息对应的offset
主从服务器复制偏移量
- 概念:一个数字,描述复制缓冲区中的指令字节位置
- 分类:
- master复制偏移量:记录已发送的信息对应的offset(多个)
- slave复制偏移量:记录已接收的信息对应的offset(一个)
- 数据来源:
- master端:发送一次记录一次
- slave端:接受一次记录一次