对于redis主从架构,master接受到请求之后执行完会立刻返回给client,然后会异步复制给其他master,此时会出现两种问题:
- 当集群节点间网络或其他问题导致异步复制延时很高,如果此时master宕机了,毫无疑问会丢失延时的这段时间的数据
- 当网络分区变化导致master和slave节点之间无法正常通信时,sentinel哨兵集群会选举slave为master,此时与之前master连接的client一直发送数据,当我们进行恢复将原master当做新master的slave节点的时候,那么后来一直发送到原master内存的数据会丢失
解决上述两种数据丢失的问题,redis配置文件中有以下两行:
min-slaves-to-write 3
min-slaves-max-lag 10
意味着至少要有3个slave节点与master保持10秒钟以内的数据同步,否则master就不会接受新的请求我们需要采取其他措施来应对