21 | 缓冲区:一个可能引发“惨案”的地方


Redis核心技术与实战

实践篇

21 | 缓冲区:一个可能引发“惨案”的地方

缓冲区的功能主要是:用一块内存空间来暂时存放命令数据,以免出现因为数据和命令的处理速度慢于发送速度而导致的数据丢失和性能问题。

因为缓冲区的内存空间有限,如果往里面写入数据的速度持续地大于从里面读取数据的速度,就会导致缓冲区需要越来越多的内存来暂存数据。当缓冲区占用的内存超出了设定的上限阈值时,就会出现缓冲区溢出。如果发生了溢出,就会出现数据丢失。

疑问:如果不给缓冲区的大小设置上限,会怎样?

随着累积的数据越来越多,缓冲区占用内存空间越来越大,一旦耗尽了 Redis 实例所在机器的可用内存,就会导致 Redis 实例崩溃。

Redis 是典型的 client-server 架构,所有的操作命令都需要通过客户端发送给服务器端。所以,缓冲区在 Redis 中的有两个主要应用场景:

  • 在客户端和服务器端之间进行通信时,用来暂存客户端发送的命令数据,或者是服务器端返回给客户端的数据结果。
  • 在主从节点间进行数据同步时,用来暂存主节点接收的写命令和数据。
客户端输入和输出缓冲区

为了避免客户端和服务器端的请求发送和处理速度不匹配,服务器端给每个连接的客户端都设置了一个输入缓冲区和输出缓冲区,称之为客户端输入缓冲区和输出缓冲区。

输入缓冲区会先把客户端发送过来的命令暂存起来,Redis 主线程再从输入缓冲区中读取命令,进行处理。当 Redis 主线程处理完数据后,会把结果写入到输出缓冲区,再通过输出缓冲区返回给客户端,如下图所示:

在这里插入图片描述

如何应对输入缓冲区溢出?

输入缓冲区就可能导致溢出的情况主要是下面两种:

  • 写入了 bigkey,比如一下子写入了多个百万级别的集合类型数据;
  • 服务器端处理请求的速度过慢,例如,Redis 主线程出现了间歇性阻塞,无法及时处理正常发送的请求,导致客户端发送的请求在缓冲区越积越多。

疑问:如何查看输入缓冲区的内存使用情况?

要查看和服务器端相连的每个客户端对输入缓冲区的使用情况,使用 CLIENT LIST 命令:

CLIENT LIST
id=5 addr=127.0.0.1:50487 fd=9 name= age=4 idle=0 flags=N db=0 sub=0 psub=0 
multi=-1 qbuf=26 qbuf-free=32742 obl=0 oll=0 omem=0 events=r cmd=client

主要参数 :

  • addr:表示客户端的 IP 和端口号。
  • cmd:表示客户端最新执行的命令。
  • qbuf:表示输入缓冲区已经使用的大小。
  • qbuf-free:表示输入缓冲区尚未使用的大小。

qbuf 和 qbuf-free 的总和就是,Redis 服务器端当前为已连接的这个客户端分配的输入缓冲区总大小。

如果 qbuf 很大,而同时 qbuf-free 很小,说明输入缓冲区已经占用了很多内存,而且没有什么空闲空间了。此时,客户端再写入大量命令的话,就会引起客户端输入缓冲区溢出,Redis 的处理办法就是把客户端连接关闭,结果就是业务程序无法进行数据存取。

通常情况下,Redis 服务器端不止服务一个客户端,当多个客户端连接占用的内存总量,超过了 Redis 的 maxmemory 配置项时(例如 4GB),就会触发 Redis 进行数据淘汰。 一旦数据被淘汰出 Redis,再要访问这部分数据,就需要去后端数据库读取,这就降低了业务应用的访问性能。此外,如果使用多个客户端,导致 Redis 内存占用过大,也会导致内存溢出(out-of-memory)问题,进而会引起 Redis 崩溃,给业务应用造成严重影响。

疑问:如何避免输入缓冲区溢出?

Redis 的客户端输入缓冲区大小的上限阈值,在代码中就设定为了 1GB。也就是说,Redis 服务器端允许为每个客户端最多暂存 1GB 的命令和数据。

Redis 并没有提供调节客户端输入缓冲区的大小的参数。所以,如果要避免输入缓冲区溢出,则要避免客户端写入 bigkey,以及避免 Redis 主线程阻塞。

如何应对输出缓冲区溢出?

Redis 为每个客户端设置的输出缓冲区也包括两部分:

  • 一部分,是一个大小为 16KB 的固定缓冲空间,用来暂存 OK 响应和出错信息;
  • 另一部分,是一个可以动态增加的缓冲空间,用来暂存大小可变的响应结果。

什么情况下会发生输出缓冲区溢出?

  • 服务器端返回 bigkey 的大量结果;
  • 执行了 MONITOR 命令;
  • 缓冲区大小设置得不合理。

执行MONITOR 命令

MONITOR 命令是用来监测 Redis 执行的。执行这个命令之后,就会持续输出监测到的各个命令操作,如下所示:

MONITOR
OK
1600617456.437129 [0 127.0.0.1:50487] "COMMAND"
1600617477.289667 [0 127.0.0.1:50487] "info" "memory"

MONITOR 的输出结果会持续占用输出缓冲区,并越占越多,最后的结果就是发生溢出。所以,MONITOR 命令主要用在调试环境中,尽量不要在线上生产环境中持续使用 MONITOR。

输出缓冲区大小设置

通过 client-output-buffer-limit 配置项,来设置缓冲区的大小。具体设置的内容包括两方面:

  • 设置输出缓冲区大小的上限阈值
  • 设置输出缓冲区持续写入数据的数量上限阈值,和持续写入数据的时间的上限阈值

对于和 Redis 实例进行交互的应用程序来说,主要使用两类客户端和 Redis 服务器端交互,分别是常规和 Redis 服务器端进行读写命令交互的普通客户端,以及订阅了 Redis 频道的订阅客户端。

给普通客户端设置缓冲区大小:

client-output-buffer-limit normal 0 0 0

normal 表示设置的是普通客户端,后面的三个参数分别是:缓冲区大小限制、缓冲区持续写入量的限制、缓冲区持续写入时间的限制。

对于普通客户端来说,它每发送完一个请求,会等到请求结果返回后,再发送下一个请求,这种发送方式称为阻塞式发送。 在这种情况下,如果不是读取体量特别大的 bigkey,服务器端的输出缓冲区一般不会被阻塞的。

所以,通常把普通客户端的缓冲区大小限制,以及持续写入量限制、持续写入时间限制都设置为 0,也就是不做限制。

对于订阅客户端来说,一旦订阅的 Redis 频道有消息,服务器端都会通过输出缓冲区把消息发给客户端。
给订阅客户端设置缓冲区大小:

client-output-buffer-limit pubsub 8mb 2mb 60

pubsub 参数表示当前是对订阅客户端进行设置;8mb 表示输出缓冲区的大小上限为 8MB,一旦实际占用的缓冲区大小要超过 8MB,服务器端就会直接关闭客户端的连接;2mb 和 60 表示,如果连续 60 秒内对输出缓冲区的写入量超过 2MB 的话,服务器端也会关闭客户端连接。

主从集群中的缓冲区

主从集群间的数据复制包括全量复制和增量复制两种。全量复制是同步所有数据,而增量复制只会把主从库网络断连期间主库收到的命令,同步给从库。无论在哪种形式的复制中,为了保证主从节点的数据一致,都会用到缓冲区。

复制缓冲区的溢出问题

在全量复制过程中,主节点在向从节点传输 RDB 文件的同时,会继续接收客户端发送的写命令请求。这些写命令就会先保存在复制缓冲区(replication buffer) 中,等 RDB 文件传输完成后,再发送给从节点去执行。主节点上会为每个从节点都维护一个复制缓冲区,来保证主从节点间的数据同步。

在这里插入图片描述

如果在全量复制时,从节点接收和加载 RDB 较慢,同时主节点接收到了大量的写命令,写命令在复制缓冲区中就会越积越多,最终导致溢出。复制缓冲区一旦发生溢出,主节点也会直接关闭和从节点进行复制操作的连接,导致全量复制失败。

疑问:如何避免复制缓冲区发生溢出?

  • 控制主节点保存的数据量大小。 通常,把主节点的数据量控制在 2~4GB,这样可以让全量同步执行得更快些,避免复制缓冲区累积过多命令。
  • 使用 client-output-buffer-limit 配置项,来设置合理的复制缓冲区大小。 设置的依据,就是主节点的数据量大小、主节点的写负载压力和主节点本身的内存大小。
config set client-output-buffer-limit slave 512mb 128mb 60

假设一条写命令数据是 1KB,那么,复制缓冲区可以累积 512K 条(512MB/1KB = 512K)写命令。同时,主节点在全量复制期间,可以承受的写命令速率上限是 2000 条 /s(128MB/1KB/60 约等于 2000)。

在实际应用中设置复制缓冲区的大小时,可以根据写命令数据的大小和应用的实际负载情况(也就是写命令速率),来粗略估计缓冲区中会累积的写命令数据量;然后,再和所设置的复制缓冲区大小进行比较,判断设置的缓冲区大小是否足够支撑累积的写命令数据量。

主节点上复制缓冲区的内存开销,会是每个从节点客户端输出缓冲区占用内存的总和。

如果集群中的从节点数非常多的话,主节点的内存开销就会非常大。所以,必须得控制和主节点连接的从节点个数,不要使用大规模的主从集群。

复制积压缓冲区的溢出问题

主节点在把接收到的写命令同步给从节点时,同时会把这些写命令写入复制积压缓冲区(repl_backlog_buffer)。一旦从节点发生网络闪断,再次和主节点恢复连接后,从节点就会从复制积压缓冲区中,读取断连期间主节点接收到的写命令,进而进行增量同步,如下图所示:

在这里插入图片描述

复制积压缓冲区是一个大小有限的环形缓冲区。当主节点把复制积压缓冲区写满后,会覆盖缓冲区中的旧命令数据。如果从节点还没有同步这些旧命令数据,就会造成主从节点间重新开始执行全量复制。

解决复制积压缓冲区的溢出问题,可以调整复制积压缓冲区的大小,也就是设置 repl_backlog_size 这个参数的值。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

久违の欢喜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值