C语言一共有41个操作符,分15个优先级。
因为优先级不同,导致的结合性不同,所以需要为不同的优先级引入非终结符号抽象。
如果按照标准EBNF文法,需要为每一个优先级引入一个非终结符号,然后再为每个终结符号编写对应的分析函数,这样需要15个分析函数。
这样虽然合理,但是对于C语言这种比较简单的语言来说,却显多余。
假设一个C语言表达式如下:
expr: term{ + term}//抽象加表达式
term:factor {* factor}//乘法表达式
factor:ID | '(' expr ')'//基础表达式或者终结符号
则对于expr的分析函数为expr():term();while(t == +){get_next_token(); term();}
对于term的分析函数term():factor();while(t == *){get_next_token(); facor();}
factor用来处理终结符号或者基础表达式。
这个文法基本来说具有两个优先级,需要三个非终结符号抽象,一个+,一个*,还有一个基本表达式。
但是看上面标红的两行来说,格式基本一致,只是调用的具体分析函数term和factor不同,最终都会调用到最后的分析函数factor。
所以对于二元运算符来说,在处理到最高优先级之前的递归逻辑都几乎一致。
parser(priority){
if(priority > 最大的二元运算符优先级)
<