目录
维表join常见性能问题
高 qps 下访问维表存储引擎产生的任务背压,数据产出延迟问题
举个例子:
- 在没有使用维表的情况下:一条数据从输入 Flink 任务到输出 Flink 任务的时延假如为
0.1 ms
,那么并行度为 1 的任务的吞吐可以达到1 query / 0.1 ms = 1w qps
- 在使用维表之后:每条数据访问维表的外部存储的时长为
2 ms
,那么一条数据从输入 Flink 任务到输出 Flink 任务的时延就会变成2.1 ms
,那么同样并行度为 1 的任务的吞吐只能达到1 query / 2.1 ms = 476 qps
。两者的吞吐量相差21 倍
这就是为什么维表 join 的算子会产生背压,任务产出会延迟
解决方案
抛开 Flink SQL 想一下,如果我们使用 DataStream API,甚至是在做一个后端应用,需要访问外部存储时,常用的优化方案有哪些?这里列举一下:
- 按照 redis 维表的 key 分桶 + local cache:通过按照 key 分桶的方式,让大多数据的维表关联的数据访问走之前访问过得 local cache 即可。这样就可以把访问外部存储 2.1 ms 处理一个 query 变为访问内存的 0.1 ms 处