redis高可用（主从复制篇）

lans_g

已于 2022-08-16 15:21:53 修改

阅读量577

点赞数 1

分类专栏： redis 文章标签： redis 数据库 database 缓存 nosql

于 2022-05-09 16:32:17 首次发布

本文链接：https://blog.csdn.net/lans_g/article/details/124669358

版权

redis 专栏收录该内容

14 篇文章 2 订阅

订阅专栏

一、主从复制概述

要避免单点故障，保证高可用，便需要冗余（副本）方式提供集群服务。而Redis 提供了主从库模式，以保证数据副本的一致，主从库之间采用的是读写分离的方式。

主从复制，是指将一台Redis服务器的数据，复制到其他的Redis服务器。前者称为主节点(master)，后者称为从节点(slave)；数据的复制是单向的，只能由主节点到从节点。

1.主从复制的作用：

数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。
故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复。
负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务，分担服务器负载；在写少读多的场景下，通过多个从节点分担读负载，可以大大提高Redis服务器的并发量。
高可用基石：主从复制是哨兵和集群能够实施的基础。

2.读写分离的实现：

读操作：主库、从库都可以接收；
写操作：首先到主库执行，然后主库同步给从库。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MMSfcm8y-1660634409860)(E:/Blog/lansg/source/img/image-20220509152320719.png)]

二、主从复制原理

1.全量复制

比如第一次同步时，将主库的数据全部同步到从库中。

当我们启动多个 Redis 实例的时候，它们相互之间就可以通过 replicaof命令形成主库和从库的关系（Redis 5.0 之前使用 slaveof），之后会按照三个阶段完成数据的第一次同步。

eg.现在有实例 1（ip：172.16.19.3）和实例 2（ip：172.16.19.5），我们在实例 2 上执行以下这个命令后，实例 2 就变成了实例 1 的从库，并从实例 1 上复制数据。

replicaof 172.16.19.3 6379

三个阶段：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gW0jPwob-1660634409862)(E:/Blog/lansg/source/img/image-20220509153400462.png)]

（1）主从库间建立连接、协商同步，为全量复制做准备。在这一步，从库和主库建立起连接，并告诉主库即将进行同步，主库确认回复后，主从库间就可以开始同步了。

具体来说，从库给主库发送 psync 命令，表示要进行数据同步，主库根据这个命令的参数来启动复制。psync 命令包含了主库的 runID 和复制进度 offset 两个参数。

runID是每个 Redis 实例启动时都会自动生成的一个随机 ID，用来唯一标记这个实例。

offset表示复制偏移量，主服务器和从服务器都会分别维护一个偏移量。

当从库和主库第一次复制时，因为不知道主库的 runID，所以将 runID 设为“？”。offset，此时设为 -1，表示第一次复制。主库收到 psync 命令后，会用 FULLRESYNC 响应命令带上两个参数：主库 runID 和主库目前的复制进度 offset，返回给从库。从库收到响应后，会记录下这两个参数。这里有个地方需要注意，FULLRESYNC 响应表示第一次复制采用的全量复制，也就是说，主库会把当前所有的数据都复制给从库。

（2）主库将所有数据同步给从库。从库收到数据后，在本地完成数据加载。这个过程依赖于内存快照生成的 RDB 文件。

具体来说，主库执行 bgsave 命令，生成 RDB 文件，接着将文件发给从库。从库接收到 RDB 文件后，会先清空当前数据库，然后加载 RDB 文件。这是因为从库在通过 replicaof 命令开始和主库同步前，可能保存了其他数据。为了避免之前数据的影响，从库需要先把当前数据库清空。在主库将数据同步给从库的过程中，主库不会被阻塞，仍然可以正常接收请求。但是，这些请求中的写操作并没有记录到刚刚生成的 RDB 文件中。为了保证主从库的数据一致性，主库会在内存中用专门的 replication buffer，记录 RDB 文件生成后收到的所有写操作。

（3）主库会把第二阶段执行过程中新收到的写命令，再发送给从库。

具体来说，当主库完成 RDB 文件发送后，就会把此时 replication buffer 中的修改操作发给从库，从库再重新执行这些操作。这样一来，主从库就实现同步了。

2.增量复制

只会把主从库网络断连期间主库收到的命令，同步给从库。

增量复制很好理解，毕竟每次都全部复制数据的话开销太大了，所以只把缺少的数据复制就好了。

复制流程：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ub1GGgmg-1660634409863)(E:/Blog/lansg/source/img/image-20220509154227858.png)]

首先看一下两个概念： replication buffer 和 repl_backlog_buffer

replication buffer：Redis和客户端通信也好，和从库通信也好，Redis都需要给分配一个内存buffer进行数据交互，客户端是一个client，从库也是一个client，我们每个client连上Redis后，Redis都会分配一个client buffer，所有数据交互都是通过这个buffer进行的：Redis先把数据写到这个buffer中，然后再把buffer中的数据发到client socket中再通过网络发送出去，这样就完成了数据交互。所以主从在增量同步时，从库作为一个client，也会分配一个buffer，只不过这个buffer专门用来传播用户的写命令到从库，保证主从数据一致，我们通常把它叫做replication buffer。
repl_backlog_buffer：也叫复制积压缓冲区。它是为了从库断开之后，如何找到主从差异数据而设计的环形缓冲区（实际上是一个固定长度的先进先出队列）。如果从库断开时间太久，repl_backlog_buffer环形缓冲区被主库的写命令覆盖了，那么从库连上主库后只能乖乖地进行一次全量复制，所以repl_backlog_buffer配置尽量大一些，可以降低主从断开后全量复制的概率。

当主服务器进行命令传播时，它不仅会将写命令发送给所有从服务器，还会将写命令入队到复制积压缓冲区中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-K24YvDPz-1660634409863)(E:/Blog/lansg/source/img/image-20220509160556311.png)]