http://www.zengl.com/html/genlanmu/zenglbianchengyuyan/article-2.html
文法消除左递归理解:产生式:
E -> E+T | T
可以看出 E 最终能正推导出T或是T(+T)*,从而写出 E->TE',然后 E'就显然了,写出E' -> +TE'|ε,所以:
E -> TE'
E' -> +TE'|ε
具体到某个文法上,比如:
expr -> expr op term | term,转换为
expr -> term T
T -> op term | ε
在文法进行判断时,先判断 op 再判断 term,如果没有 op,则认为为空
三地址码通常按其所显示的内容实现,这意味着4个域是必须的:1个操作符和3个地址。对于那些少于3个地址的指令,将一个或多个地址域置成null或empty,具体选择哪个域取决于实现。必须有4个域的三地址码叫 四元式。
三地址码另一个不同的实现是用自己的指令来代表临时变量,这样地址域从 3个减少到了两个。因此在三地址指令中包含 3个地址而目标地址总是一个临时变量 。如此的三地址码实现称为三元式 ( t r i p l e )。它要求:或是通过数组的索引号或是通过链表指针,每个三地址指令都是可引用的,
中间代码是一种独立于具体硬件的记号系统,有以下方式:
1 三元式
2 间接三元式
3 逆波兰记号
4 树形表示
5 四元式
编译器设计过程:
词法分析
作用:输入源程序,输出单词符号
单词符号分类:关键字,标志符,常数,运算符,界符
语法分析:
语义分析:
中间代码生成:
代码优化:
目标代码生成: