yacc是一个语法分析程序的自动生成器。
yacc文件构成
说明部分
%%
规则部分
%%
程序部分
%%
%%
规则部分
%%
程序部分
%%
"%{"与"%}"是说明部分的起始符和与结束符。
终端和非终端符号
终端符号:代表一类在语法结构上等效的标记。
终端符号有三种类型:
命名标记:这些由 %token 标识符来定义。按照惯例,它们都是大写。
字符标记:字符常量的写法与 C 相同。例如, -- 就是一个字符标记。
字符串标记:写法与 C 的字符串常量相同。例如,"<<" 就是一个字符串标记。
lexer 返回命名标记。
非终端符号:是一组非终端符号和终端符号组成的符号。按照惯例,它们都是小写。
终端符号有三种类型:
命名标记:这些由 %token 标识符来定义。按照惯例,它们都是大写。
字符标记:字符常量的写法与 C 相同。例如, -- 就是一个字符标记。
字符串标记:写法与 C 的字符串常量相同。例如,"<<" 就是一个字符串标记。
lexer 返回命名标记。
非终端符号:是一组非终端符号和终端符号组成的符号。按照惯例,它们都是小写。
终端符号的书写方式
%token tname1 tname2...
tname1,tname2都分别表示不同的终端符号。
%token tname1 integer1
integer1表示终端符号tname1的内部编码值。
当选用第一种方式时,当终结符为名字时,其编码值由257开始。并按先后顺序,增量为1。文字符号的编号就是其在符号表中的数值。
当按第二种方式时,终结符的编码由用户指定。
tname1,tname2都分别表示不同的终端符号。
%token tname1 integer1
integer1表示终端符号tname1的内部编码值。
当选用第一种方式时,当终结符为名字时,其编码值由257开始。并按先后顺序,增量为1。文字符号的编号就是其在符号表中的数值。
当按第二种方式时,终结符的编码由用户指定。
union的定义和类型定义
利用union的定义和类型定义,就可以使yacc提供其他类型的返回值。具体做法是在说明部分给出一个union的定义,使其包括所期望的数据类型。在类型定义节里,对每个具有这种特殊要求的终结符或者非终结符与union中所定义的成员名进行相互搭配。
%union
{
int type_type;
char char_type;
QTREE *tree_type;
}
%type <type_type> IS
%type <tree_type> tlist
%union
{
int type_type;
char char_type;
QTREE *tree_type;
}
%type <type_type> IS
%type <tree_type> tlist
结合性与优先级
优先级与结合性定义由下面的形式给出
关键字1 终结符表1
关键字2 终结符表2
其中关键字用来定义跟在它后边的终结符号的结合性
%left 定义跟在它后面的终结符为左结合。
%right 定义跟在它后面的终结符为右结合。
%nonassoc 定义跟在它后面的终结符无结合性。
终结符优先级定义由行序来确定。
1 由同一关键字引出的,出现在同一行的终结符具有相同的优先级。
2 后行的优先级总是高于前行。
关键字1 终结符表1
关键字2 终结符表2
其中关键字用来定义跟在它后边的终结符号的结合性
%left 定义跟在它后面的终结符为左结合。
%right 定义跟在它后面的终结符为右结合。
%nonassoc 定义跟在它后面的终结符无结合性。
终结符优先级定义由行序来确定。
1 由同一关键字引出的,出现在同一行的终结符具有相同的优先级。
2 后行的优先级总是高于前行。