语法分析器处理有词法分析器转换生成的程序, 从语法分析器的视角来看, 输入的程序是一个单词流, 其中各个单词都标注了语法范畴, 即词类。 如果语法分析器确定输入流是一个有效程序,它将构建该程序的一个具体模型, 供编译的后续各阶段使用, 否则,语法分析器将向用户报告问题和适当的诊断信息。
对语法分析器来说, 首要职责是识别语法, 即确定被编译的程序在程序设计语言的语法模型中是否是一个有效语句。该模型表示为一个形式语法(Formal Grammar) 为G, 如果某个单词串s 属于G定义的语言, 我们就说G可以推导出s。对于单词流s 和语法G, 语法分析器试图构建一个构造性证明, 以表明s可以在G中推导出来。从特定输入语句构造推导的过程称为 语法分析。
将推导过程表示为图的树称为语法分析树。语法分析树的根是已知的, 它表示语法的起始符号。 语法分析树的叶子节点也是已知的, 它们必须按从左到右的顺序逐一匹配词法分析器返回的单词流。 语法分析困难的不妨在于要找到叶子节点和根节点之间的语法关联。
有以下两种方法来构建语法树:
1,自顶向下语法分析器 (top-down parser)
2,自底向上语法分析器 (bottom-up parser)
自顶向下语法分析器从根开始构建语法分析树, 并使树向叶子的方向增长。 在每一步, 自顶向下语法分析器都在树的下边缘选择一个表示某个非终结符的结点用一个子树来扩展该结点; 子树表示了重写该非终结符时所用产生式的右侧部分。
自底向上语法分析器从叶子结点开始构建语法分析树, 并使树向根的方向增长。在每一步, 自底向上语法分析器都在语法分析树的上边缘处识别出一个连续的子串, 该子串与某个产生式的右侧匹配, 接下来构建一个结点表示该产生式的左侧, 并将其连接到树中。