主要内容包括:
-
平台建设现状
-
遇到的问题及解决
-
未来规划
01平台建设现状
美团于 2018 年首次引入 Flink 实时计算引擎,当时的实时数仓概念还不太普及,平台只提供了 Flink Jar 任务的生命周期管理和监控报警。
2019 年,我们注意到实时计算的主要应用场景是解决离线数仓时效性低的问题。离线数仓已经比较成熟,通过 SQL 方式开发很简单,而数仓的实时部分主要通过 Flink DataStream API 来开发,门槛比较高,而且与离线数仓的开发方式相比较为割裂。因此,我们开始调研实时数仓的解决方案,目标是降低开发门槛,并尝试推广 FlinkSQL,最终将美团的实时数仓平台取名为 NAU。
2020 年,美团实时数仓平台正式上线。它向业务提供 FlinkSQL 作业开发入口,主要负责两个方面的工作:
-
首先,将实时数仓常见的数据源与离线表概念对齐,用数据模型进行管理;
-
其次,提供 FlinkSQL 开发配套的效率工具,比如校验和调试功能。
但是在实际推广过程中,我们发现业务在 FlinkSQL 的运维方面门槛依然比较高,因此,我们将接下来的