Spark SQL表达式解析器-Scala Parser与Antlr4

本文介绍了Spark SQL如何利用Scala Parser和Antlr4解析SQL表达式。在Spark 2.0之前,使用Scala Parser,之后转向Antlr 4。Antlr 4提供Visitor和Listener模式,方便处理解析后的语法树。文中还分享了作者使用Antlr 4创建表达式解析器的经验,并推荐使用Antlr 4的IDEA插件进行测试。
摘要由CSDN通过智能技术生成

Spark SQL表达式解析器-Scala Parser与Antlr4

版权声明:本文为博主原创文章,未经博主允许不得转载。

手动码字不易,请大家尊重劳动成果,谢谢

作者:http://blog.csdn.net/wang_wbq

Spark SQL之所以能支持如此强大的表达式系统,是因为其包含了一套字符串解析并生成表达式树的模块。

Scala Parser

在Spark 2.0之前,Spark SQL使用Scala Parser功能去解析SQL表达式,其解析类为org.apache.spark.sql.catalyst.SqlParser

对于没用使用过Scala Parser的人来讲,这个类基本上就可以称为天书了。其中用到的几个基本符号:


~ 连接符,并将左右侧匹配结果保留
~> 连接符,仅保留右侧匹配结果,左侧将丢弃
<~ 连接符,仅保留左侧匹配结果,右侧将丢弃。该连接符优先级低于 ~ 和 ~>
^^ 其左侧为词法表达式,右侧为一个函数
   例如:p1 ~ p2 ^^ { case a ~ b => a + b }
   这个表达式可以把p1和p2匹配出的结果分别赋值给a和b,
   注意:此
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值