前言
这个编译原理是一个系列,系列地址为: https://blog.csdn.net/lpstudy/article/category/937055
考虑到很多小伙伴咨询代码的问题,现把链接发出来:https://github.com/lpstudy/compile
这个链接里面具有这个系列所有的VS工程和代码,工程是按照系列中的一个教程环境配置6来配置的,不过lib我好像没有上传到github。
如果大家发现任何问题,可以在github或者csdn,我有空的时候完善一下,争取做到下载github工程即可跑。
简介
本章在上一节7的基础上对编译树进行完善。 上一节7的编译树仅仅支持算术表达式的+-基本运算,本节对其进行扩充,使其支持不仅支持基本的算术运算,还支持变量,支持语句(if, while,input, ouput),经过这次扩充,它形成的语法树已经基本具备了表达minus-c语言的能力。
简单说来,它可以表示下面的c语言代码:
a = 1
if(a>10){
a = 11
}else{
a = 7
}
print(a)
a =1
sum = 0
while(a <= 10){
sum = sum + a
a = a+1;
}
print(sum)
根据上述的c语言代码,通过手动构建对应的语法树,然后后序遍历语法树,就可以执行代码,输出结果。本节的编译树代码并不关注如何根据c语言代码自动构建语法树(lex和yacc支持), 而是着眼于对手动构建的语法树进行遍历执行。
语句的处理
if语句
if(expr) {stmt1} else {stmt2}
对于if树节点,它具有3个孩子,expr,stmt1,stmt2. 当后序遍历到if节点时候,它首先判断expr是否为真,如果为真,则执行stmt1,否则执行stmt2,因此当执行后序遍历的时候,我们会有这样的代码:
if(t->kind == STMT_NODE){
if(t->kind_kind == IF_STMT){
//if条件判断结果,第二个孩子存储if成功的代码,第三个孩子存储else成功的代码
recursive_execute(t->children[0]);
if (my_mem[t->children[0]->addr] )
recursive_execute(t->children[1]);
else
recursive_execute(t->children[2]);
}//IF_STMT
}//STMT_NODE
如上面的代码所示,首先根据t->kind判断是否是语句节点,然后根据子类型t->kind_kind判断是否是if节点。如果是的话,首先递归执行第一个孩子,执行完毕后,结果保存在my_mem[t->children[0]->addr]中,然后判断它的值是否为真,如果为真,则执行stmt1,否则执行stmt2。
while语句
while(expr) {stmt}
与if不同的是,while只有两个孩子,expr和stmt, 同时当expr为真的时候,stmt会循环执行,直到expr为假。因此遍历代码如下:
if(t->kind_kind == WHILE_STMT){
//第一个孩子存储条件判断结果,第二个孩子存储while成功的代码
recursive_execute(t->children[0]);
while (my_mem[t->children[0]->addr])
{
recursive_execute(t->children[1]);
recursive_execute(t->children[0]);
}
}
输入输出语句
输入输出相当于修改或者打印给定节点对应的内存的值,因此就非常简单,代码如下:
else if(t->kind_kind == INPUT_STMT){//input statement has one expr child
cout<<"please input data:";
cin>>my_mem[t->children[0]->addr];
}else if(t->kind_kind == PRINT_STMT){//print statement has one expr child to print.
recursive_execute(t->children[0]);
cout<<my_mem[t->children[0]->addr];
}
复合语句
复合语句是用来包装多个简单语句的,例如如果有3个语句,它们之间是顺序执行的关系,但是最后生成是一棵树,因此需要将3个语句组合在一起,简单来说就是将这3个语句的Node作为一个复合语句Node的孩子,当遍历执行的时候,只需要逐个执行每一个孩子即可。
代码如下:
else if(t->kind_kind == COMP_STMT){//组合语句,逐个语句执行即可。
for (int i = 0; i < MAX_CHILDREN; ++i)
recursive_execute(t->children[i]);
}
表达式语句
表达式语句就是基本的表达式后面加上分号,例如b=1;这就是一个语句,它是一个赋值表达式然后加上分号构成的语句。为了简单起见,对于表达式语句,它只有一个孩子就是表达式,因此表达式语句的执行就是执行它的孩子(表达式)
代码如下:
else if(t->kind_kind == EXPR_STMT){
recursive_execute(t->children[0]);
}
表达式的处理
表达式有很多种,例如二元的加减乘除,逻辑运算与或非,比较运算符,一元的取非,自增自减等等,以及还是纯粹的数字,变量表达式。简单起见,本代码只考虑支持基本的二元运算以及数字和变量表达式,它的执行代码比较简单,不具体阐述,示意如下:
if (t->kind == EXPR_NODE){ // 表达式结点
recursive_execute(t->children[0]);
recursive_execute(t->children[1]);
if (t->kind_kind == OP_EXPR) { // 运算类型表达式
if (t->attr.op == PLUS) // 加法表达式
// 从内存(my_mem)中取出两个孩子的值,进行加法,结果写回内存
my_mem[t->addr] = my_mem[t->children[0]->addr] + my_mem[t->children[1]->addr];
else if (t->attr.op == MINUS) // 减法的处理类似加法
my_mem[t->addr] = my_mem[t->children[0]->addr] - my_mem[t->children[1]->addr];
else if (t->attr.op == TIMES)
my_mem[t->addr] = my_mem[t->children[0]->addr] * my_mem[t->children[1]->addr];
else if (t->attr.op == OVER){
if(my_mem[t->children[1]->addr] == 0){
cout<<"error: divide by zero"<<endl;
my_mem[t->addr] = 0;
}else