spark sql 2.3 源码解读 - antlr4 && SparkSqlParser (2.2)

最新推荐文章于 2024-09-02 17:46:37 发布

sddyljsx

最新推荐文章于 2024-09-02 17:46:37 发布

阅读量1.7k

点赞数

分类专栏： Spark Spark Sql 2.3源码解读

本文链接：https://blog.csdn.net/sddyljsx/article/details/81608371

版权

Spark 同时被 2 个专栏收录

14 篇文章 1 订阅

订阅专栏

Spark Sql 2.3源码解读

14 篇文章 10 订阅

订阅专栏

接着上一节，我们看一下antlr4。

antlr可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition，其前身是PCCTS，它为包括Java，C++，C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器（recognizer），编译器（parser）和解释器（translator）的框架。

参考此文：https://www.cnblogs.com/sld666666/p/6145854.html，我们用antlr4来实现一个四则运算器：

grammar Calc;

prog : stat+;

stat : expr             # printExpr
     | ID '=' expr      # assign
     | 'print(' ID ')'  # print
     ;

expr : <assoc=right> expr '^' expr # power
     | expr op=(MUL|DIV) expr   # MulDiv
     | expr op=(ADD|SUB) expr   # AddSub
     | sign=(ADD|SUB)?NUMBER       # number
     | ID                       # id
     | '(' expr ')'             # parens
     ;


ID   : [a-zA-Z]+;
NUMBER  : [0-9]+('.'([0-9]+)?)?
        | [0-9]+;
COMMENT : '/*' .*? '*/' -> skip;
LINE_COMMENT : '//' .*? '\r'? '\n' -> skip;
WS   : [ \t\r\n]+ -> skip;
MUL  : '*';
DIV  : '/';
ADD  : '+';
SUB  : '-';