如果你为master配置了一个slave,不管这个slave是否是第一次连接上Master,它都会发送一个PSYNC命令给master请求复制数据。
master收到PSYNC命令后,会在后台进行数据持久化通过bgsave生成最新的rdb快照文件,持久化期间,master会继续接收客户端的请求,它会把这些可能修改数据集的请求缓存在内存中。当持久化进行完毕以后,master会把这份rdb文件数据集发送给slave,slave会把接收到的数据进行持久化生成rdb,然后再加载到内存中。然后,master再将之前缓存在内存中的命令发送给slave。
当master与slave之间的连接由于某些原因而断开时,slave能够自动重连Master,如果master收到了多个slave并发连接请求,它只会进行一次持久化,而不是一个连接一次,然后再把这一份持久化的数据发送给多个并发连接的slave。
数据全量复制
- slave连接master
- slave发送psync命令
- master收到psync命令,执行bgsave生成最新rdb快照数据,同时把后续写命令都缓存起来
- master发送rdb数据给slave
- slave清空老数据并加载rdb数据
- master发送缓存数据给slave
- slave执行缓存里的命令
- master通过长连接持续把写命令发送给从节点
数据部分复制
当master和slave断开重连后,一般都会对整份数据进行复制。但从redis2.8版本开始,redis改用可以支持部分数据复制的命令PSYNC去master同步数据,slave与master能够在网络连接断开重连后只进行部分数据复制(断点续传)。
master会在其内存中创建一个复制数据用的缓存队列,缓存最近一段时间的数据,master和它所有的slave都维护了复制的数据下标offset和master的进程id,因此,当网络连接断开后,slave会请求master继续进行未完成的复制,从所记录的数据下标开始。如果master进程id变化了,或者从节点数据下标offset太旧,已经不在master的缓存队列里了,那么将会进行一次全量数据的复制。
- slave断开master
- master把slave断开后的后续写命令进行缓存(repl backlog buffer)
- slave连接master
- slave发送psync(offset)命令
- master收到psync(offset)命令,判断该slave传来的offset,在 repl backlog buffer 中是否存在,存在的话,master会将offset之后的数据一次性同步给slave,不存在的话,做全量同步
- slave执行缓存里的命令
- master通过长连接持续把写命令发送给从节点
主从复制风暴
如果有很多从节点,为了缓解主从复制风暴(多个从节点同时复制主节点导致主节点压力过大),可以让部分从节点与从节点(与主节点同步)同步数据,即一颗树