摘要:介绍了YF language编程语言的AST及IR表示
根据前面定义的语法,基本上AST就已经被决定了。因为语法每reduce一次,要么组建一个新AST,要么在已有的AST上添加数据。这里照惯例采用了访问者模式,将Code Generator设为访问者,遍历全部AST。遍历过程中,在每个AST结点调用3个过程:genSymbolTable( ), checkType( ), genIRCode( ),分别是生成符号表,检查类型,生成IR。因为在第一遍生成符号表的时候,很可能引用到的符号是后文出现的未知的,比如后面定义class A,前面是不能判断A是否合理的类型。我并不想用一趟生成符号表和检查类型,太复杂,而两趟完成比较容易实现。
符号表,我的设计是分为变量表、类型表、函数表三种,目的是省略了一个判断过程,其实全部放进一个表也行。我将符号表放置在AST内,这样的好处是利于定义可用范围,因为Code Generator访问进入AST后可以在里面查找符号,省略了用额外的指针将符号表与某个AST相关联来确定访问范围。checkType过程中查找符号,如果本层AST查找不到,那么就向上查找,这个访问链都在Code Generator的维护中。
IR是三地址码,也就是说,一条三地址码包含4个元素,大部分情况下,第一个是操作符,第二个是返回地址,第三、四个是操作对象的地址。IR对应的虚拟机模型有无限的寄存器,所以,临时变量用“%”+数字,既代表一个新的寄存器,也为将来升级为SSA形式做好准备,到时只需少量修改和加上phi函数就可