Redis主从复制的笔记

最新推荐文章于 2022-08-15 09:53:08 发布

搬砖党弟中弟

最新推荐文章于 2022-08-15 09:53:08 发布

阅读量79

点赞数

分类专栏： redis 文章标签： redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daima_caigou/article/details/109603451

版权

redis 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

命令

从机执行 slaveof [master.ip] [master.port]开始主从同步，用配置文件也可以

过程简述

1、slave >>> 发送PSYNC命令 >>> master

2、master 调用 bgsave命令 fork 一个后台子进程生产 rdb 文，并在缓冲区中记录从现在开始执行的写命令。

3、master 发送 rdb 文件到 slave，slave 丢弃自己所有的数据并阻塞自己，专心做 rdb 读取，数据恢复。

4、在这个过程中，master接收了client的写命令会记录在复制缓冲区，发送给slave进行同步

5、之后master再接收写命令，先记录缓冲区，再发送给slave

第2步的细节过程如下

复制缓冲区

默认大小为1M，由master维护的一个固定长度的FIFO队列，它的作用是缓存已经传播出去的命令。

当master进行命令传播时，不仅将命令发送给所有slave，还会将命令写入到复制积压缓冲区里面。

全量复制的时候，master的数据更新（读写操作，主动过期删除等）会临时存放在backlog中待全量复制完成后增量发到slave

复制偏移量（offset）

对应复制缓冲区中的字符偏移，笔者认为，就简单理解为Kafka里的offset也可以

slave断线重连

主从节点之间已经初步实现了数据同步，

往后的 master，会将收到的每一条写命令发送给 slave 并添加到复制缓冲区并根据字节数计算更新自己的偏移量，slave 收到传输过来的命令后也一样更新自己的偏移量。

这样，只要主从节点的偏移量相同就说明主从节点之间的数据是同步的。

复制缓冲区大小是固定的，新的写命令进来以后，旧的数据就会出队列。

如果某个 slave 断线重连之后，依然向 master 发送 PSYNC 命令并携带自己的偏移量，

master 判断该偏移量是否还在缓冲区区间内，如果在则直接将该偏移量往后的所有偏移量对应的命令发送给 slave，无需重新进行全量复制。

数据丢失情况

1、主从复制是异步的，丢数据的可能必然存在。

2、脑裂引发的问题
（脑裂描述：某个master所在机器突然脱离了正常的网络，跟其他slave机器不能连接，但是实际上master还运行着。

此时哨兵可能就会认为master宕机了，然后开启选举将其他slave切换成了master。集群里就会有两个master，也就是所谓的脑裂。）

此时虽然某个slave被切换成了master，但是可能client还没来得及切换到新的master，还继续写向旧master的数据可能也丢失了。

因此旧master再次恢复的时候，会被作为一个slave挂到新的master上去，自己的数据会清空，重新从新的master复制数据

透过现象看本质

1、复制是异步的，主从天然不对等，主机被物理破坏了，不存在什么主从切换，你现在只能启动从机临时顶一顶，数据丢失是必然的。

2、主从切换的机制问题：【一个slave挂到新的master上去，自己的数据会清空，重新从新master复制数据】

3、脑裂问题比上述1、2更严重的是，不光把存量数据丢了，还把client新发来的数据也弄丢了。

及时止损

数据丢失的问题是解决不了的。只能通过配置的方式尽量让数据丢失的少一些

// 表示 master 至少有 1 个副本连接，默认0
min-slaves-to-write 1
// 数据复制和同步的延迟不能超过 10 秒，默认10
min-slaves-max-lag 10

上述配置要求：至少有1个slave，数据复制和同步的延迟不能超过10秒。

如果说一旦所有的slave，数据复制和同步的延迟都超过了10秒钟，那么这个时候，master就不会再接收任何请求了。

搬砖党弟中弟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Redis主从复制的笔记

命令从机执行slaveof [master.ip] [master.port]开始主从同步，用配置文件也可以过程简述1、slave>>>发送PSYNC命令>>> master2、master 调用 bgsave命令fork 一个后台子进程生产 rdb 文，并在缓冲区中记录从现在开始执行的写命令。3、master 发送 rdb 文件到 slave，slave 丢弃自己所有的数据并阻塞自己，专心做 rdb 读取，数据恢复。4、在这个过程中，...
复制链接

扫一扫

专栏目录

搬砖党弟中弟 CSDN认证博客专家 CSDN认证企业博客

码龄8年

45: 原创

8万+: 周排名

76万+: 总排名

12万+: 访问

: 等级

1474: 积分

50: 粉丝

137: 获赞

39: 评论

215: 收藏

私信

关注

热门文章

分类专栏

最新评论

Kafka之ISR机制的理解
chenpeiyanbing: ISR是有个参数可以设置吧？但是按照博主的意思，这是个黑盒，kafka自己维护。
Kafka之ISR机制的理解
熊哼哼: 总结：Kafka采用的就是一种完全同步的方案，而ISR是基于完全同步的一种优化机制。这句写的挺好
Kafka之ISR机制的理解
janchin: replica.lag.max.messages 并未移除，只是进行了扩展定义，除了最后拉取间隔时间之外，该参数还表示如果最后一次和leader对齐时间。
Kafka可靠性之HW与Leader Epoch
12frame: 其他文章我看的一脸懵，搞不懂为什么都木有疑问，或许是我太菜了
Kafka之ISR机制的理解
是橙汁啊: 请问那不是很容易出现数据丢失的问题吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。