Redis 复制详解

Redis 复制详解1. 复制配置1.1 建立复制1.2 断开复制1.3 安全性1.4 只读1.5 传输延迟2. 拓扑2.1 一主一从结构2.2 一主多从结构2.3 树状主从结构3. 复制原理3.1 复制过程3.2 数据同步3.3 全量复制3.4 部分复制  在分布式系统中为了解决单点问题,通常会把数据复制多个副本部署到其他机器,满足故障恢复和负载均衡等需求。Redis 也是如此,它为我们提供了复制功能,实现了相同数据的多个 Redis 副本。  1. 复制配置1.1 建立复制  参与复制的 Re
摘要由CSDN通过智能技术生成


  在分布式系统中为了解决单点问题,通常会把数据复制多个副本部署到其他机器,满足故障恢复和负载均衡等需求。Redis 也是如此,它为我们提供了复制功能,实现了相同数据的多个 Redis 副本。

  

1. 复制配置

1.1 建立复制

  参与复制的 Redis 实例划分为主节点 (master) 和从节点 (slave)。默认情况下,Redis 都是主节点。每个从节点只能有一个主节点,而主节点可以 同时具有多个从节点。复制的数据流是单向的,只能由主节点复制到从节点。配置复制的方式有以下三种:

  1. 在配置文件中加入 slaveof {masterHost} {masterPort} 随 Redis 启动生效;
  2. 在 redis-server 启动命令后加入 --slaveof {masterHost} {masterPort} 生效;
  3. 直接使用命令:slaveof {masterHost} {masterPort} 生效。

  综上所述,slaveof 命令在使用时,可以运行期动态配置,也可以提前写到配置文件中。

# 例如本地启动两个端口为6379和6380的Redis节点,在 127.0.0.1:6380执行如下命令:
127.0.0.1:6380>slaveof 127.0.0.1 6379

  slaveof 配置都是在从节点发起,这时6379 作为主节点,6380 作为从节点。复制关系建立后执行如下命令测试:

127.0.0.1:6379>set hello redis 
OK
127.0.0.1:6379>get hello
"redis"

127.0.0.1:6380>get hello 
"redis"

  从运行结果中看到复制已经工作了,针对主节点 6379 的任何修改都可以同步到从节点 6380中,复制过程如图所示

在这里插入图片描述

  slaveof 本身是异步命令,执行 slaveof 命令时,节点只保存主节点信息后返回,后续复制流程在节点内部异步执行,主从节点复制成功建立后,可以使用 info replication 命令查看复制相关状态,如下所示

# 主节点6379复制状态信息

127.0.0.1:6379>info replication
# Replication
role:master
connected_slaves:1 slave0:ip=127.0.0.1,port=6379,state=online,offset=43,lag=0 ....

# 从节点6380复制状态信息
127.0.0.1:6380>info replication 
# Replication
role:slave master_host:127.0.0.1 master_port:6380 master_link_status:up 
master_last_io_seconds_ago:4 master_sync_in_progress:0 ...

  

1.2 断开复制

  slaveof 命令不但可以建立复制,还可以在从节点执行 slaveof no one 来断开与主节点复制关系。例如在 6380 节点上执行 slaveof no one 来断开复制

  

断开复制主要流程

  • 断开与主节点复制关系;
  • 从节点晋升为主节点。
      从节点断开复制后并不会抛弃原有数据,只是无法再获取主节点上的数据变化。

  
  通过 slaveof 命令还可以实现切主操作,所谓切主是指把当前从节点对主节点的复制切换到另一个主节点。执行 slaveof {newMasterIp} {newMasterPort} 命令即可,例如把 6380节点从原来的复制 6379节点变为复制 6381节点

  
切主操作流程如下

  • 断开与旧主节点复制关系;
  • 与新主节点建立复制关系;
  • 删除从节点当前所有数据;
  • 对新主节点进行复制操作。

切主后从节点会清空之前所有的数据,线上人工操作时小心 slaveof 在错误的节点上执行或者指向错误的主节点。

  

1.3 安全性

  对于数据比较重要的节点,主节点会通过设置 requirepass 参数进行密码验证,这时所有的客户端访问必须使用 auth 命令实行校验。从节点与主节点的复制连接是通过一个特殊标识的客户端来完成,因此需要配置从节点的 masterauth 参数与主节点密码保持一致,这样从节点才可以正确地连接到主节点并发起复制流程。

  

1.4 只读

  默认情况下,从节点使用 slave-read-only=yes 配置为只读模式。由于复制只能从主节点到从节点,对于从节点的任何修改主节点都无法感知,修改从节点会造成主从数据不一致。因此建议线上不要修改从节点的只读模式

  

1.5 传输延迟

  主从节点一般部署在不同机器上,复制时的网络延迟就成为需要考虑的问题,Redis 为我们提供了 repl-disable-tcp-nodelay 参数用于控制是否关闭 TCP_NODELAY,默认关闭:

  • 当关闭时,主节点产生的命令数据无论大小都会及时地发送给从节点,这样主从之间延迟会变小,但增加了网络带宽的消耗。适用于主从之间的网络环境良好的场景,如同机架或同机房部署;
  • 当开启时,主节点会合并较小的 TCP 数据包从而节省带宽。默认发送时间间隔取决于 Linux的内核,一般默认为 40毫秒。这种配置节省了带宽但增大主从之间的延迟。适用于主从网络环境复杂或带宽紧张的场景,如跨机房部署。

部署主从节点时需要考虑网络延迟、带宽使用率、防灾级别等因素,

  • 如要求低延迟时,建议同机架或同机房部署并关闭 repl-disable-tcp-nodelay;
  • 如果考虑高容灾性,可以同城跨机房部署并开启 repl-disable-tcp-nodelay。

  

  

2. 拓扑

  Redis 的复制拓扑结构可以支持单层或多层复制关系,根据拓扑复杂性可以分为以下三种:一主一从、一主多从、树状主从结构。

  

2.1 一主一从结构

  一主一从结构是最简单的复制拓扑结构,用于主节点出现宕机时从节点提供故障转移支持,

  • 当应用写命令并发量较高且需要持久化时,可以只在从节点上开启AOF,这样既保证数据安全性同时也避免了持久化对主节点的性能干扰;
  • 但需要注意的是,当主节点关闭持久化功能时, 如果主节点脱机要避免自动重启操作。因为主节点之前没有开启持久化功能自动重启后数据集为空,这时从节点如果继续复制主节点会导致从节点数据也被清空的情况,丧失了持久化的意义;
  • 安全的做法是在从节点上执行 slaveof no one 断开与主节点的复制关系,再重启主节点从而避免这一问题。

在这里插入图片描述

  

2.2 一主多从结构

  一主多从结构 (又称为星形拓扑结构) 使得应用端可以利用多个从节点实现读写分离,

  • 对于读占比较大的场景,可以把读命令发送到从节点来分担主节点压力;
  • 同时在日常开发中如果需要执行一些比较耗时的读命令,如:keys、sort等,可以在其中一台从节点上执行,防止慢查询对主节点造成阻塞从而影响线上服务的稳定性;
  • 对于写并发量较高的场景,多个从节点会导致主节点写命令的多次发送从而过度消耗网络带宽,同时也加重了主节点的负载影响服务稳定性。

在这里插入图片描述

  

2.3 树状主从结构

  树状主从结构 (又称为树状拓扑结构) 使得从节点不但可以复制主节点数据,同时可以作为其他从节点的主节点继续向下层复制

  • 通过引入复制中间层,可以有效降低主节点负载和需要传送给从节点的数据量。

在这里插入图片描述

  

  

3. 复制原理

3.1 复制过程

  在从节点执行 slaveof 命令后,复制过程便开始运作,下面详细介绍建立复制的完整流程,如图所示:

在这里插入图片描述

  1. 保存主节点(master)信息:
    • 8195;执行 slaveof 后从节点只保存主节点的地址信息便直接返回,这时建立复制流程还没有开始。
  2. 从节点 (slave) 内部通过每秒运行的定时任务维护复制相关逻辑, 当定时任务发现存在新的主节点后,会尝试与该节点建立网络连接:
    • 从节点会建立一个socket套接字,专门用于接受主节点发送的复制命令;
    • 如果从节点无法建立连接,定时任务会无限重试直到连接成功或者执行 slaveof no one 取消复制;
  3. 发送 ping 命令:连接建立成功后从节点发送ping请求进行首次通信
    • 如果发送 ping 命令后,从节点没有收到主节点的 pong 回复或者超时,比如网络超时或者主节点正在阻塞无法响应命令,从节点会断开复制连接,下次定时任务会发起重连;
    • 从节点发送的 ping 命令成功返回,并继续后续复制流程
  4. 权限验证:
    • 如果主节点设置了 requirepass 参数,则需要密码验证,从节点必须配置masterauth 参数保证与主节点相同的密码才能通过验证;
    • 如果验证失败复制将终止,从节点重新发起复制流程
  5. 同步数据集:
    • 主从复制连接正常通信后,对于首次建立复制的场景,主节点会把持有的数据全部发送给从节点,这部分操作是耗时最长的步骤;
    • Redis 在 2.8版本以后采用新复制命令 psync 进行数据同步,原来的sync命令依然支持,保证新旧版本的兼容性。新版同步划分两种情况:全量同步和 部分同步
  6. 命令持续复制:
    • 当主节点把当前的数据同步给从节点后,便完成了复制的建立流程。接下来主节点会持续地把写命令发送给从节点,保证主从数据一致性。

  

3.2 数据同步

  Redis 在 2.8及以上版本使用 psync 命令完成主从数据同步,同步过程分
为:全量复制部分复制

  • 全量复制:一般用于初次复制场景,Redis 早期支持的复制功能只有全量复制,它会把主节点全部数据一次性发送给从节点,当数据量较大时,会对主从节点和网络造成很大的开销;
  • 部分复制:用于处理在主从复制中因网络闪断等原因造成的数据丢失场景,当从节点再次连上主节点后,如果条件允许,主节点会补发丢失数据给从节点。因为补发的数据远远小于全量数据,可以有效避免全量复制的过高开销。

  

psync 命令运行需要以下组件支持:

  • 主从节点各自复制偏移量;
  • 主节点复制积压缓冲区;
  • 主节点运行id。

  

  1. 复制偏移量
      参与复制的主从节点都会维护自身复制偏移量。主节点 (master) 在处理完写入命令后,会把命令的字节长度做累加记录,统计信息在 info relication 中的 master_repl_offset 指标中
      从节点 (slave) 每秒钟上报自身的复制偏移量给主节点,因此主节点也会保存从节点的复制偏移量。

在这里插入图片描述

  
2. 复制积压缓冲区
  复制积压缓冲区是保存在主节点上的一个固定长度的队列,默认大小为 1MB,当主节点有连接的从节点 (slave) 时被创建,这时主节点 (master) 响应写命令时,不但会把命令发送给从节点,还会写入复制积压缓冲区。

在这里插入图片描述

  由于缓冲区本质上是先进先出的定长队列,所以能实现保存最近已复制数据的功能,用于部分复制和复制命令丢失的数据补救,复制缓冲区相关统计信息保存在主节点的 info replication 中

127.0.0.1:6379> info replication 
# Replication
role:master
...
repl_backlog_active:1  // 开启复制缓冲区
repl_backlog_size:1048576 // 缓冲区最大长度
repl_backlog_first_byte_offset:7479 // 起始偏移量,计算当前缓冲区可用范围 
repl_backlog_histlen:1048576  // 已保存数据的有效长度。

  

  1. 主节点运行ID
      每个 Redis 节点启动后都会动态分配一个 40位的十六进制字符串作为运行 ID。运行 ID的主要作用是用来唯一识别 Redis节点,比如从节点保存主节点的运行 ID识别自己正在复制的是哪个主节点。如果只使用 ip+port 的方式识别主节点,那么主节点重启变更了整体数据集 (如替换RDB/AOF文件), 从节点再基于偏移量复制数据将是不安全的,因此当运行ID 变化后从节点将做全量复制。

需要注意的是Redis关闭再启动后,运行ID会随之改变,如何在不改变运行ID的情况下重启呢?

  • 可以使用 debug reload命令重新加载RDB并保持运行ID不变,从而有效避免不必要的全量复制。
  • debug reload 命令会阻塞当前Redis节点主线程,阻塞期间会生成本地 RDB快照并清空数据之后再加载RDB文件。因此对于大数据量的主节点和无 法容忍阻塞的应用场景,谨慎使用
  1. psync命令
      从节点使用 psync 命令完成部分复制和全量复制功能,命令格式:
    psync {runId} {offset},参数含义如下:
  • runId:从节点所复制主节点的运行id。
  • offset:当前从节点已复制的数据偏移量

psync命令运行流程如图:

在这里插入图片描述

流程说明:

  • 从节点 (slave) 发送 psync 命令给主节点,参数 runId 是当前从节点保存的主节点运行ID,如果没有则默认值为空,参数 offset 是当前从节点保存的复制偏移量,如果是第一次参与复制则默认值为 -1;
  • 主节点 (master) 根据 psync 参数和自身数据情况决定响应结果:
    • 如果回复 +FULLRESYNC {runId} {offset},那么从节点将触发全量复制;
    • 如果回复 +CONTINUE,从节点将触发部分复制流程;
    • 如果回复 +ERR,说明主节点版本低于 Redis2.8,无法识别 psync 命令, 从节点将发送旧版的 sync 命令触发全量复制流程。

  

3.3 全量复制

  全量复制是 Redis 最早支持的复制方式,也是主从第一次建立复制时必须经历的阶段。触发全量复制的命令是 sync 和 psync。

全量复制的完整运行流程如图所示:

在这里插入图片描述

  1. 发送 psync 命令进行数据同步,由于是第一次进行复制,从节点没有复制偏移量和主节点的运行ID,所以发送 psync-1;
  2. 主节点根据 psync-1 解析出当前为全量复制,回复 +FULLRESYNC 响应;
  3. 从节点接收主节点的响应数据保存运行ID 和偏移量 offset;
  4. 主节点执行 bgsave 保存 RDB 文件到本地;
  5. 主节点发送 RDB 文件给从节点,从节点把接收的 RDB 文件保存在本地并直接作为从节点的数据文件;

需要注意,对于数据量较大的主节点,比如生成的 RDB 文件超过 6GB 以上时要格外小心。传输文件这一步操作非常耗时,速度取决于主从节点之间网络带宽;
如果传输总时间超过 repl-timeout 所配置的值 (默认60秒),从节点将放弃接受 RDB 文件并清理已经下载的临时文件,导致全量复制失败。
针对数据量较大的节点,建议调大 repl-timeout 参数防止出现全量同步数据超时。

  1. 对于从节点开始接收 RDB 快照到接收完成期间,主节点仍然响应读写命令,因此主节点会把这期间写命令数据保存在复制客户端缓冲区内,当从节点加载完 RDB 文件后,主节点再把缓冲区内的数据发送给从节点,保证主从之间数据一致性。如果主节点创建和传输 RDB 的时间过长,对于高流量写入场景非常容易造成主节点复制客户端缓冲区溢出。默认配置为 client- output-buffer-limit slave256MB 64MB 60,如果 60秒内缓冲区消耗持续大于 64MB 或者直接超过 256MB时,主节点将直接关闭复制客户端连接,造成全量同步失败。
  2. 从节点接收完主节点传送来的全部数据后会清空自身旧数据。
  3. 从节点清空数据后开始加载 RDB 文件,对于较大的 RDB 文件,这一步操作依然比较耗时;
  4. 从节点成功加载完 RDB 后,如果当前节点开启了 AOF 持久化功能, 它会立刻做bgrewriteaof 操作,为了保证全量复制后 AOF 持久化文件立刻可用;

  

通过分析全量复制的所有流程,会发现全量复制是一个非常耗时费力的操作。它的时间开销主要包括:

  • 主节点 bgsave 时间;
  • RDB文件网络传输时间。
  • 从节点清空数据时间。
  • 从节点加载RDB的时间。
  • 可能的AOF重写时间

  

3.4 部分复制

  部分复制主要是 Redis 针对全量复制的过高开销做出的一种优化措施, 使用psync{runId}{offset} 命令实现。当从节点 (slave) 正在复制主节点 (master) 时,如果出现网络闪断或者命令丢失等异常情况时,从节点会向 主节点要求补发丢失的命令数据,如果主节点的复制积压缓冲区内存在这部 分数据则直接发送给从节点,这样就可以保持主从节点复制的一致性。补发 的这部分数据一般远远小于全量数据,所以开销很小。

在这里插入图片描述
流程说明:

  1. 当主从节点之间网络出现中断时,如果超过 repl-timeout 时间,主节点会认为从节点故障并中断复制连接;
  2. 主从连接中断期间主节点依然响应命令,但因复制连接中断命令无法发送给从节点,不过主节点内部存在的复制积压缓冲区,依然可以保存最近一段时间的写命令数据,默认最大缓存1MB;
  3. 当主从节点网络恢复后,从节点会再次连上主节点;
  4. 当主从连接恢复后,由于从节点之前保存了自身已复制的偏移量和主节点的运行ID。因此会把它们当作 psync 参数发送给主节点,要求进行部分复制操作;
  5. 主节点接到 psync 命令后首先核对参数 runId 是否与自身一致,如果一致,说明之前复制的是当前主节点;之后根据参数 offset 在自身复制积压缓冲区查找,如果偏移量之后的数据存在缓冲区中,则对从节点发送 +CONTINUE 响应,表示可以进行部分复制;
  6. 主节点根据偏移量把复制积压缓冲区里的数据发送给从节点,保证主从复制进入正常状态;
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值