构建语言类应用程序,最简单的方式是操作语法分析器自动生成的语法分析树。
ANTLR在识别和建立语法分析树的过程中使用的数据结构和类名 如下:
词法分析器处理字符序列并将生成的词法符号提供给语法分析器,语法分析器随即根据这些信息来检查语法的正确性并建造一颗语法分析树。这个过程对应的ANTLR类是 CharStream、Lexer、Token、Parser,以及ParserTree
连接词法分析器和语法分析器的“管道”就是TokenStream,下图展示了这些类型对象在内存中的交互方式
ANTLR尽可能多的使用共享数据结构来节约内存。每个词法符号都记录了自己在字符序列中的开始位置和结束位置,而非保存子字符串的拷贝。
ParseTree的子类RuleNode和TerminalNode分别是子树的根节点和叶子节点。
RuleNode有一些令人熟悉的方法,例如getChild()和getParent(),但对于一个特定的语法,RuleNode并不是确定不变的。为了更好的支持对特定节点元素的访问,ANTLR会为每条规则生成一个RuleNode的子类,如上图,子树根节点的类型实际上是StatContext、AssignContext以及ExprContext
因为这些根节点包含了使用规则识别词组过程中的全部信息,它们被称为上下文(context)对象
给定这些类型的具体实现,我们可以手工写出对语法分析树进行深度优先遍历的代码,并实现计算结果、更新数据结构或者产生输出一类的事情。实际上,我们可以利用ANTLR自动生成遍历树的机制,而不需要每次都重复编写遍历树的代码。