本文主要面向初学者介绍Antlr4,一款常用语词法语法解析器生成的第三方工具包。全文主要回答几个问题:
- 1、antlr的是什么?
- 2、antlr的功能有哪些,如何使用?
- 3、在公司中使用antlr案例?
不知道各位是如何关注到antlr,笔者是因为硕士阶段需要写SQL解析器才渐渐了解到它。后来发现它在大数据中非常实用,尤其在SQL方面。
Terence Parr的The Definitive Antlr 4 Reference
1、antlr的是什么?
它是一个非常强大的文本及二进制文件的解析、翻译和处理的工具。大家熟悉的Hive和Spark使用antlr生成词法语法解析器、Twitter使用antlr来解析用户输入的查询内容,Oracle把antlr的功能内嵌在SQL 开发IDE中,NetBeans IDE使用antlr解析C++语言,也有公司使用antlr来从文件中抽取信息。
其实antlr原则上应该是领域特定语言(DSL)开发工具,不仅适用于SQL,还可以用于其他自定义语言。
以上都是很官方的说明,antlr到底是什么,该怎么用,下面举2个简单例子,一个是简化SQL解析器,一个是翻译器。antlr的使用从写文法文件开始,文件后缀是g4.
####2、antlr的功能及使用
1)简易SQL解析器g4文法文件
这里创建一个SqlExample.g4的文件
grammar SqlExample:
fragment A_ : &#