Spark和Hive的ANSI SQL支持情况

Spark 2.0.x支持的SQL:
-----------------
Spark SQL2003支持情况:社区目前主要是支持缺少的大功能subquery,细节功能主要是IBM的人在系统地添加( https://issues.apache.org/jira/secure/Dashboard.jspa?selectPageId=12326761 )。

具体缺少的2003细节功能可查看 http://www.savage.net.au/SQL/sql-2003-2.bnf.html  中的BNF文档
6 Scalar expressions
7 Query expressions
8 Predicates
10 Additional common elements
这几个关于查询的语法的章节内容逐个对照语法来确认缺少的SQL支持。

Spark的语法支持稍滞后于Hive的支持。Hive的目前活跃的SQL支持主要在这些功能 https://issues.apache.org/jira/browse/HIVE-13554

Hive支持的SQL:
-----------------
1.支持66个tpc-ds测例。
2.支持主要的sql2003功能:
<1>基本subquery有,缺失的稍复杂的subquery的功能如在and/or中出现的multi-subquery, 在select子句中的in/exist/correlated subquery,scalar subquery values可出现在value expression primary语句能出现的所有位置,在不等谓词条件中的subquery in comparison predicate这些细节功能意识到了还在添加,主要是hortonworks的工程师在做,但社区添加速度不快。
<2>缺失的non-equi join功能社区没确定是否添加
<3>缺失的集合功能Intersect (distinct/all) Except (distinct/all) Minus (distinct/all)已添加还没发布
3.sql2011兼容:基本都还是sql2003的内容,没有涉及sql2011的核心的时态temporal查询功能。

参考:
1. https://github.com/apache/spark/pull/10509    inline hive资料,spark中去掉hive parser依赖
2. http://www.spark.tc/the-arrival-of-apache-spark-2-0-2/   IBM spark technology center的贡献
3. http://zh.hortonworks.com/blog/stinger-next-enterprise-sql-hadoop-scale-apache-hive/   hortonwork对hive的改进思路
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值