Redis数据同步机制

0. 原文迁移

Redis数据同步机制https://blog.csdn.net/iflink/article/details/122389644

Redis的主从同步机制可以确保redis的master和slave之间的数据同步。
Redis在2.8及以上版本使用psync命令完成主从数据同步。
同步方式包括:全量复制和增量复制

01. 同步机制

1.1 全量拷贝

在这里插入图片描述

  1. slave第一次启动时,连接Master,发送PSYNC命令,格式为psync {runId} {offset}

    {runId} 为master的运行id;{offset}为slave自己的复制偏移量。
    slave第一次连接master时,slave并不知道master的runId,也不知道自己偏移量,这时候slave会传一个问号和-1,告诉master节点是第一次同步。格式为psync ? -1

  2. 当master接收到psync ? -1时,知道slave是要全量复制,就会将自己的runIdoffset告知slave,回复命令fullresync {runId} {offset}。同时,master会执行bgsave命令来生成rdb文件,期间的所有写命令将被写入缓冲区。

    slave接受到master的回复命令后,会保存master的runIdoffset,slave此时处于同步状态。
    slave处于同步状态,如果此时收到请求,当配置参数slave-server-stale-data yes时,会响应当前请求;slave-server-stale-data no,返回错误。

  3. master bgsave执行完毕,向slave发送rdb文件。rdb文件发送完毕后,开始向slave发送缓冲区中的写命令。
  4. slave收到rdb文件,丢弃所有旧数据,开始载入rdb文件。
  5. rdb文件同步结束之后,slave执行从master缓冲区发送过来的所以写命令。
  6. 此后 master 每执行一个写命令,就向slave发送相同的写命令。

1.2 增量拷贝

  1. 如果出现网络闪断或者命令丢失等异常情况时,当主从连接恢复后,由于从节点之前保存了自身已复制的偏移量和主节点的运行ID。因此会把它们当作psync参数发送给主节点,要求进行部分复制操作,格式为psync {runId} {offset}
  2. 主节点接到psync命令后首先核对参数runId是否与自身一致,如果一致,说明之前复制的是当前主节点;之后根据参数offset在自身复制积压缓冲区查找,如果偏移量之后的数据存在缓冲区中,则对从节点发送+continue响应,表示可以进行部分复制;否则进行全量复制。
  3. 主节点根据偏移量把复制积压缓冲区里的数据发送给从节点,保证主从复制进入正常状态。

02. 同步故障处理

2.1 拷贝超时

  1. 对于数据量较大的主节点,比如生成的rdb文件超过6GB以上时要格外小心。传输文件这一步操作非常耗时,速度取决于主从节点之间网络带宽,通过细致分析full resync和masterslave这两行日志的时间差,可以算出rdb文件从创建到传输完毕消耗的总时间。如果总时间超过repl-timeout所配置的值(默认60秒),从节点将放弃接受rdb文件并清理已经下载的临时文件,导致全量复制失败。
  2. 针对数据量较大的节点,建议调大repl-timeout参数防止出现全量同步数据超时。

    例如对于千兆网卡的机器,网卡带宽理论峰值大约每秒传输100MB,在不考虑其他进程消耗带宽的情况下,6GB的rdb文件至少需要60秒传输时间,默认配置下,极易出现主从数据同步超时。

2.2 积压缓冲区拷贝溢出

  1. slave节点从开始接收rdb文件到接收完成期间,主节点仍然响应读写命令,因此主节点会把这期间写入命令保存在复制积压缓冲区内,当从节点加载完rdb文件后,主节点再把缓冲区内的数据发送给从节点,保证主从之间数据一致性。
  2. 如果主节点创建和传输RDB的时间过长,对于高流量写入场景非常容易造成主节点复制客户端缓冲区溢出。默认配置为client-output-buffer-limit slave 256MB 64MB 60,如果60秒内缓冲区消耗持续大于64MB或者直接超过256MB时,主节点将直接关闭复制客户端连接,造成全量同步失败。
  3. 因此,运维人员需要根据主节点数据量和写命令并发量调整client-output-buffer-limit slave配置,避免全量复制期间客户端缓冲区溢出。对于主节点,当发送完所有的数据后就认为全量复制完成,打印成功日志:synchronization with slave127.0.0.1:6380 succeeded

2.3 slave全量同步的响应问题

  1. slave节点接收完主节点传送来的全部数据后会清空自身旧数据,执行flash old data,然后加载rdb文件。对于较大的rdb文件,这一步操作依然比较耗时。
  2. 对于线上做读写分离的场景,从节点也负责响应读命令,如果slave节点正出于全量复制阶段,那么slave节点在响应读命令可能拿到过期或错误的数据。对于这种场景,redis复制提供了slave-server-stale-data yes参数(默认开启),如果开启则slave节点依然响应所有命令。对于无法容忍不一致的应用场景可以设置no来关闭命令执行,此时从节点除了infoslaveof命令之外所有的命令只返回sync with master in progress信息

03. 节点名词阐述

3.1 节点运行ID

  1. 每个Redis节点启动后,都会动态分配一个40位的十六进制字符串作为运行ID,即{runId}

    运行ID的主要作用是用来唯一识别Redis节点,比如从节点保存主节点的运行ID识别自己正在复制的是哪个主节点。

  2. 如果只使用ip+port的方式识别主节点,那么主节点重启变更了整体数据集(如替换rdb/aof文件),从节点再基于偏移量复制数据将是不安全的,因此当运行ID变化后从节点将做全量复制。
  3. 可以运行info server命令查看当前节点的运行ID。

3.2 偏移量拷贝

  1. 参与复制的主从节点都会维护自身复制偏移量,即{offset}
  2. 主节点(master)在处理完写入命令后,会把命令的字节长度做累加记录,统计信息在info relication中的 master_repl_offset 指标中。
  3. 从节点(slave)在接收到主节点发送的命令后,也会累加记录自身的偏移量,统计信息在info relication命令的slave_repl_offset指标中
  4. 从节点(slave)每秒钟上报自身的复制偏移量给主节点,因此主节点也会保存从节点的复制偏移量。

3.2 积压缓冲区拷贝

  1. 存在于主节点(master),默认大小为1MB,可以通过参数rel_backlog_size来修改默认大小。
  2. 复制积压缓冲区是保存在主节点上的一个固定长度的队列。当从节点(slave)连接主节点时被创建,这时主节点(master)响应写命令时,不但会把命令发送给从节点,还会写入复制积压缓冲区。
  3. 由于缓冲区本质上是先进先出(FIFO)的定长队列,所以能实现保存最近已复制数据的功能,用于部分复制和复制命令丢失的数据补救。复制缓冲区相关统计信息可以通过主节点的info replication命令查看。
  • 9
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
1.redis支持的数据结构 string list hash set zset(基本回答) 加分项:另外redis还对这几种数据结构做了扩展,如GEO对位置计算,hyperLogLog做统计,bitmaps:redis底层存储value值都是存储的二进制数据redis提供bitmaps(位图)可以直接访问或修改底层存储的二进制数据 2.redis线程模型 redis是单线程实现。 3.redis 提供的持久机制 redis 支持rdb和aof两种持久机制,redis4.0后支持混合持久化。rdb是定时的持久机制,宕机有可能会丢失最后一次持久化之后存在数据丢失。aof是基于操作日志追加的持久机制。(基本回答) 加分项: 1.rdb持久化原理 原理是redis会单独创建(fork)一个与当前进程一模一样的子进程来进行持久化, 这个子线程的所有数据(变量。环境变量,程序程序计数器等)都和原进程一模一样,会先将数据写入到一个临时文件中, 待持久化结束了,再用这个临时文件替换上次持久化好的文件 2.他什么时候fork子进程,或者什么时候触发rdb持久化机制 shutdown时,如果没有开启aof,会触发 配置文件中默认的快照配置 执行命令save或者bgsave save是只管保存,其他不管,全部阻塞 bgsave: redis会在后台异步进行快照操作,同时可以响应客户端的请求,但是在调用fork函数时是阻塞的,很快,可以忽略不计 执行flushall命令 但是里面是空的,无意义 3.aof原理? 原理是将Reids的操作日志以追加的方式写入文件,读操作是不记录的 2.触发机制(根据配置文件配置项) no:表示等操作系统进行数据缓存同步到磁盘(快,持久化没保证) always:同步持久化,每次发生数据变更时,立即记录到磁盘(慢,安全) everysec:表示每秒同步一次(默认值,很快,但可能会丢失一秒以内的数据) 以下问题都是基本回答: 4.redis支持事务吗 redis可以说是半支持事务(假事务),提供了一些在一定程度上支持线程安全和事务的命令。例如:multi/exec watch inc等。但是redis的事务并不支持回滚,即可以两个命令可以同时提交执行,但是如果有失败,成功的也不会回滚 5.你们公司使用的是什么集群模式 看你写的项目经验,如果你们公司数据量特别大,公司用缓存牛逼,就说Rediscluster,小公司可以说哨兵集群 1.哨兵模式 基本回答:哨兵主要就是启动哨兵(redis特殊)节点,对主节点进行监控,如果半数以上发现ping主节点不通了,认为主节点挂了,则进行故障转移,就是选出一个从节点代替主节点 2.Rediscluster集群模式 基本回答:Rediscluster是一个高可用集群,它基于分片(对key进行crc16,然后对16384取余)的原理,可以把他理解为是由多组哨兵集群组成,但是它不依赖哨兵 6.缓存穿透 缓存穿透指的是使用不存在的key进行大量的高并发查询,这导致缓存无法命中,每次请求都要穿透到后端数据库系统进行查询,数据库压力过大。 常用解决方案:将空值缓存起来。 其他解决方案:使用布隆过滤器(guava 19开始已支持布隆过滤器) 备注:如果你可以理解太白老师讲的基于redis位图自己实现的布隆过滤器,可以说说,更加分 7.缓存击穿 缓存击穿是指缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力 解决方案:1.互斥锁 如果项目不会多部署则可以使用jvm锁,如果会多部署则使用分布式锁 8.缓存雪崩 缓存雪崩指缓存服务器重启或者大量缓存集中在某一个时间段内失效 常用解决办法: 1.主要就是要搭建高可用集群,保证机器的高可用。 2.对不同的数据使用不同的失效时间,甚至对相同的数据、不同的请求使用不同的失效时间。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值