Redis数据丢失问题

本文探讨了Redis中常见的数据丢失情况,包括DBA误操作、过期键删除、淘汰策略、客户端缓冲区溢出、主库故障重启、网络分区、异步复制和脑裂。针对这些问题,提出了配置min-slaves-to-write和min-slaves-max-lag以降低数据丢失风险的解决方案。
摘要由CSDN通过智能技术生成

常见Redis数据丢失的情况

  1. DBA/RD误操作执行flushall/flushdb这类命令。
  2. 过期键被删除。
  3. 淘汰策略删除数据。
  4. 因客户端缓冲区内存使用过大,导致大量键被LRU淘汰。
  5. 主库故障后自动重启,可能导致数据丢失。
  6. 网络分区的问题,可能导致短时间的写入数据丢失。
  7. 异步复制导致的数据丢失。
  8. 脑裂导致的数据丢失。

因客户端缓冲区内存使用过大,导致大量键被LRU淘汰

客户端缓冲区的内存大小很难限制,它们消耗的内存数会计算在used_memory内;如果使用不当,导致缓冲区内存使用过大,达到maxmemory限制;(缓存场景)会导致大量的键被淘汰,最坏会把所有键清理,缓冲无键可淘汰,写入失败。相当于整个缓冲失效,对业务影响较大。

主库故障后自动重启,可能导致数据丢失。

时间点T1,主库故障关闭了,因设置有自动重启的守护程序,时间点T2主库被重新拉起,因(T2-T1)时间间隔过小,未达到Redis集群或哨兵的主从切换判断时长;这样从库发现主库runid变了或断开过,会全量同步主库rdb清理,并清理自己的数据。而为保障性能,Redis主库往往不做数据持久化设置,那么时间点T2启动的主库,很有可能是个空实例(或很久前的rdb文件)。这种问题发生时间间隔,一般小于1分钟,可能监控告警无法感知到。

网络分区的问题,可能导致短时间的写入数据丢失。

这种问题出现丢失数据都很少,网络分区时,Redis集群或哨兵在判断故障切换的时间窗口,这段时间写入到原主库的数据,5秒~15秒的写入量。

异步复制导致的数据丢失。

因为master->slave的复制是异步的,所以可能有部分数据还没复制到slave,master就宕机了,此时这些部分数据就丢失了。

脑裂导致的数据丢失。

某个master所在机器突然脱离了正常的网络,跟其他slave机器不能连接,但是实际上master还运行着。此时哨兵可能就会认为master宕机了,然后开启选举将其他slave切换成了master。集群里就会有两个master,也就是所谓的脑裂。

此时虽然某个slave被切换成了master,但是可能client还没来得及切换到新的master,还继续写向旧master的数据可能也丢失了。因此旧master再次恢复的时候,会被作为一个slave挂到新的master上去,自己的数据会清空,重新从新的master复制数据。

解决方案:
通过在redis.conf配置控制同步时间减少数据丢失.

# 要求至少有1个slave,数据复制和同步延迟不能超过10秒
min-slaves-to-write 1

# 如果说一旦所有的slave,数据复制和同步的延迟都超过了10秒钟,那么master就会拒绝接收任何请求
min-slaves-max-lag 10

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值