Hive源码系列(七)编译模块之词法、语法解析 (中)

这篇主要举实际案例说明怎么使用antlr工具、利用antlr生成的Lexer、Parser、TreeParser代码,获取asttree。这些都是hive获取asttree的过程,理解了这些,再理解hive的asttree就很容易了

程序设计语言入门小案例一般都用“Hello World”,在编译领域的入门往往选择计算器。而我们这次的小案例就更简单:一个只能计算【两】个【整数】相【加】的计算器,比如:计算1+1...

先来考虑一下如果何下手,在我们的计算器中,只接受输入整数和加号,其它的一概不理。这里说的是整数,如果输入了一个字母,我们一定是要拒绝的...对于这一块要写对应的词法规则,这个阶段的过程就叫做词法分析

输入满足词法的规则,并不代表我们就能接受,如果是【加号】【整数】【整数】或者【整数】【整数】【加号】这样的排列,我们是不能接受的,这里接受的合法语法是【整数】【加号】【整数】,因此我们需要在词法规则的基础上再定义语法规则,规则定输入满足这样句式的才算是合法... 我们把这个阶段叫做语法分析

弄清楚了我们的词法、语法规则后,我们需要以antlr的语言把这些写出来。

antlr语法博大精深,我觉得没必要钻的太深,实现这个案例,用不到antlr太多复杂的语法,只用看懂就行

1、使用antlrworks

双击antlrworks-1.5.1.jar启动antlrworks

File-->New

选择ANTLR 3 Grammer  (*.g)  新建Calculator语法文件

输入规则:

ctrl+s 保存

Antlr的语法文件通常会保存在一个 .g的文件中,我们的语法文件叫做 Caculator.g,保存在E:\hive\anltr\calculator 目录 下

在E:\hive\anltr\calculator目录 创建output目录

File-->Preferences设置Output path

运行调试,点击图标中的小甲虫

在弹出来的调试界面中,选择 text

输入 1+2

之后将会在output窗口看到被识别出来的token流,以及具体语法分析树和ASTTree的结果

到此,就是简单使用anltrworks用语法文件来解析输入数据的过程

2、使用eclipse

新建一个java项目,antlr-my

File-->New-->Java Project

在antlr-my项目下创建grammar、lib

下载antlr-3.4-complete.jar   hive中用的是antlr3.4

http://www.java2s.com/Code/Jar/a/Downloadantlr34completejar.htm

将antlr-3.4-complete.jar放在lib下面

创建语法文件:

在grammar上面右键, New -> Other,选择 ANTLR中的Combined Grammar

输入文件名Caculator

设置antlr-my项目相关的antlr插件检查设置:

在antlr-my项目上右键 -->Properties-->ANTLR

以上设置完了之后,点ok

在Calculator.g文件中输入内容:

点击Interpreter,在expr区域输入表达式1+2 点击执行按钮:

我们可以看到下图中具体语法分析树的结果

3、用java来获取ASTTree

antlr自动生成了词法分析器CalculatorLexer.java和语法分析器 CalculatorParser.java的代码

创建测试类:TestCalculator.java

能够获取生成的ASTTree

推荐阅读:

从一个sql引发的hive谓词下推的全面复盘及源码分析(下)

​​​​​​从一个sql引发的hive谓词下推的全面复盘及源码分析(上)


Hey!

我是小萝卜算子

欢迎关注:数据仓库践行者

分享是最好的学习,这里记录我对数据仓库的实践的思考和总结

每天学习一点点

知识增加一点点

思考深入一点点

在成为最厉害最厉害最厉害的道路上

很高兴认识你

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小萝卜算子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值