Apache Calcite 为什么能这么流行

640?wx_fmt=png

这张图上列的,是直接使用 Apache Calcite 或者至少相关联的项目。大家肯定能在里面找到很多自己熟悉的项目。

那 Apache Calcite 究竟是干嘛的,又为什么能这么流行呢?

首先,摆一个应该没多少人会反对的共识:SQL 是编程领域最流行的语言。

  • 有 MySQL、Oracle 之类使用 SQL 作为交互语言的数据库

  • 然后有 JDBC、ODBC 之类和各种数据库交互的标准接口

  • 有大量数据科学家和数据分析师等不太会编程语言但又要使用数据的人

  • 第一代大数据计算引擎 MapReduce 被 Hive SQL 很大程度上替代

  • 新一代大数据计算引擎 Spark 很快就推出了 Spark SQL

  • 最近几年大热的流处理引擎 Flink 很快也推出了 Flink SQL

  • ......

这样的例子还可以举出很多。SQL 我们用起来很顺手,但实现起来呢,却并不容易。

比如要给 MongoDB 套上一个 SQL 的壳子,或者要想直接用 SQL 查一堆 CSV 文件,恐怕没多少人能顺利的自己实现。

Apache Calcite 的出现,让你能够很容易的给你的系统套上一个 SQL 的壳子,并且能提供足够高效的查询性能优化。

下面不会想很多帖子一样,去解释 Calcite 是怎么做到这一点的,这样的东西太多了,没有必要重复。

今天,我想从设计的角度聊下为什么 Calcite 能这么流行。

足够简单和 focus 的定位

640?wx_fmt=png

通常我们可以把一个数据库管理系统分为上图的五个组件。Calcite 在设计之初就确定了自己只关注和实现图中绿色标识的三个部分,而把灰色部分的数据管理和数据存储留给了各个外部存储/计算引擎

通常数据管理和数据存储,尤其是后者是很复杂的,也会由于数据本身的特性导致实现上的多样性。Calcite 抛弃了这两部分,而是专注于上层更加通用的模块,使得自己能够轻装上阵,系统的复杂性得到控制,开发人员的精力也不至于铺的太开。

另一方面,Calcite 没有去重复造各种轮子,在该用现成的东西的时候,就直接用能找到的最合适的。这是个非常好的习惯,但也是非常容易被程序员抵触的方法。

比如,作为一个 SQL 解决方案,关键的 SQL 解析这一步,Calcite 没有选择造轮子,而是直接使用了开源的 JavaCC,来将 SQL 语句转化为 Java 代码,然后转化成一颗 AST 供下一阶段使用。

另一个例子,为了支持后面会提到的灵活的元数据功能,Calcite 需要支持运行时编译 Java 代码。默认的 JavaC 太重,需要一个更轻量级的编译器,Calcite 同样没有选择造轮子,而是使用了开源的 Janino 方案。

足够简单和 focus 的定位,不重复造轮子,使得 Calcite 的实现足够简单和稳定。

灵活可插拔的架构

640?wx_fmt=png

上面的图是 Calcite 官方给出的架构图。

一方面印证了我们上面提到的,Calcite 足够简单,没有做自己不该做的事;另一方面,也是更重要的,Calcite 被设计的足够模块化和可插拔。

JDBC Driver 这个模块用来支持使用 JDBC client 的应用;SQL Parser and Validator 模块用来做 SQL 解析和校验;Expressions Builder 用来支持自己做 SQL 解析和校验的框架对接;Operator Expressions 这个模块用来处理关系表达式;Metadata Providers 用来支持外部自定义元数据;Pluggable Rules 用来定义优化规则;最核心的 Query Optimizer 则专注查询优化。

功能模块的划分足够合理,足够独立,使得不用完整集成,而是可以只选择其中的一部分使用;而基本上每个模块都支持自定义,也使得用户能更多地定制系统。

640?wx_fmt=png

上面的图展示了 10 多种框架对 Calcite 的集成情况。可以看到像 Hive 就自己做了 SQL 解析,只使用了 Calcite 的查询优化功能;而 Flink 则从解析到优化都直接使用了 Calcite。

640?wx_fmt=png

Flink 对 Calcite 的使用,从这个 Flink 的架构图看的会更清楚。Flink 提供了 Table API 和 SQL API 两种形式来支持对格式化数据的处理。 SQL API 通过 Calite 的 SQL Parser 和 Validator 转成逻辑执行计划,而 Table API 直接转换成 Calcite 的逻辑执行计划。二者在这里达到统一,再通过 Calcite 做优化,完了之后再转成对应的物理执行计划,Table API 对应对 DataSet 的操作,SQL API 对应对 DataStream 的操作。

以上说的集成方法,都是把 Calcite 的模块当做库使用。如果觉得太重量级,可以选择更简单的 Adapter 的方式。通过类似 Spark/Flume 这些框架里自定义 Source/Sink 的方式,来实现和外部系统的数据交互操作。

640?wx_fmt=png

上图列的就是集中典型的 Adapter,比如通过 MongoDB 的 Adapter 就能直接在应用层通过 SQL,而底层自动转换成 Java 和 MongoDB 完成交互。当然如果社区没有现成的实现,也很容易自己按照 API 规范去实现一个。

对多种异构数据源的支持

除了对标准 SQL 的支持,Calcite 还支持各种丰富的数据源。

640?wx_fmt=png

上图所示,就是对 MongoDB 的支持,通过 _MAP[key] 的方式就能很方便的访问到 mongo 里面的半结构化数据。

640?wx_fmt=png

上图就是对流数据的支持,通过 STREAM 关键字,扩展了 Calcite 的能力,当然还支持窗口函数等比较高级的流功能。

640?wx_fmt=png

另外,Calcite 还支持对空间地理数据的处理,也是通过一组内置的函数提供了原生支持,而不用自己再去打 UDF。

动态和灵活的查询优化

提到查询优化,不得不提关系代数(Relational Algebra)关系表达式(Relational Expression),这也是 Calcite 的核心概念之一。

这里不展开介绍,大家可以单独再去了解。

640?wx_fmt=png

我们看一个例子,上图的 SQL 语句通过 SQL 解析和验证后,会先被转换成下面这样的关系表达式:

640?wx_fmt=png

很简单,就是先对两个表做 scan,完了再用 id 字段做 join,再做一个 filter,最后 project 挑出想要的字段。

如果要用一句话解释关系代数,就是定义了什么样的关系表达式是等价的

上面的关系表达式会被 Calcite 通过关系代数转换成下面这样:

640?wx_fmt=png

相信大家都看的懂,通过 push down filter 和 push down project,大大减少了数据量,也就是减少了 IO,而 IO 通常都是性能瓶颈,自然就大大提升了性能。

这样提升性能的等价关系表达式转换,就是查询优化。

而类似 push down filter 这样的转换就叫做 planner rule。类似这样的 rule 还有很多,不一一罗列了。

知道了怎么优化,怎么样算优化完了呢,不可能一直这么转换下去吧?

当然不会,决定什么时候停止优化的是 Planner Engine

目前 Calcite 支持两种 Planner Engine:

  • HepPlanner,优化到关系表达式不再变化为止。

  • VolcanoPlanner,优化到查询成本不再明显变化为止。

很显然,HepPlanner 更表象点,不一定就能得到最优解,但优点是速度快;而 VolcanoPlanner 则更准确些,有 cost 来量化做比较,缺点自然是稍慢

用户可以自由选择用哪一种,比如 Hive 就用的 VolcanoPlanner 来做 CBO。

接着很自然能想到的问题,就是怎么计算 cost 了。

而这里又体现 Calcite 的灵活性了,除了提供默认的 cost function,还允许前面提到的 metadata provider 提供自定义的 cost function。

通常会被用来计算 cost 的有行数、空间大小、笛卡尔积大小等等,这里不过多展开。


最后,总结下。

通过

  • 足够简单和 focus 的定位

  • 可插拔的架构

Calcite 做到了让集成足够简单。

通过

  • 对多种异构数据源的支持

  • 动态和灵活的查询优化

Calcite 让自己能在更广阔的领域被使用。

这就是我今天想跟大家分享的几个要点,也是我们在系统设计过程中值得参考和借鉴的思路。


查询优化可能是 Calcite 被使用最多的功能,也是很有技术含量的一个话题。后面会单独开一篇文章,我们一起看看 Hive 是怎么利用 Calcite 做查询优化的。感兴趣的朋友请扫二维码关注我的公众号,也可以搜索「漫谈大数据」或者「sobigdata」

640?wx_fmt=jpeg

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值