第3部分,把四元式翻译成 x86 目标代码的代码生成器

help-assignment

题目描述

本实验要做的是实现一个可以把四元式翻译成 x86 目标代码的代码生成器。代码生成器求解待用信息、活跃信息和寄存器描述符地址描述符等,根据它们分配寄存器,并逐条把四元式翻译成汇编代码,注意代码生成器需要在一个基本块范围内考虑如何充分利用寄存器,而全局代码的生成则是简单地将各个基本块代码串联。

代码生成器的输入
符号表
临时变量个数
四元式
符号表是通过分析声明语句构建的,我们假定本实验中将所有的形参都视为基本块中的局部变量。在后续中间代码生成中,又加入了临时变量信息,本实验中输入的临时变量信息是临时变量的个数。本实验中没有类型转换,不会出现整型和实型相加这类操作,且整型和实型的运算在目标代码的指令生成中亦不做区分。同时假设代码中不存在任何语义错误。

目标程序的形式
本实验我们选择汇编代码作为目标程序。汇编也有 CISC 和 RISC 之分,具体来说,我们输出以 Intel 和 AMD 为代表的 X86 架构的 CISC 指令集汇编。采用 CISC 指令集有很多特殊限制,如乘除指令需要固定使用 EAX 和 EDX 寄存器等,但是本实验我们不考虑寄存器的特殊限制,在设计代码生成算法时,我们设计一个通用算法,此时的寄存器表示为 R0, R1,…的形式。且 Mul 和 Div 指令不考虑其使用寄存器的特殊性,按普通指令处理。

代码书写约定
我们把四元式编号前面加个?符号构成跳转指令的标号。更精确地,由于转移语句只可能会出现在基本块的最后一条语句,因此翻译到基本块的最后一条语句时,如果是转移语句,则在转移的目标语句前生成标号。

实际上,由于变量没有在静态数据区声明,而是在活动记录动态开辟空间,因此不能使用名字进行访问。在非嵌套过程语言的栈式实现中,我们需要通过 EBP 寄存器获得变量地址进行访问。假设变量在符号表中偏移量为 offset,对于形参,应用[EBP+offset+8]来访问该变量,对于局部变量,假设保存寄存器个数为 n,则使用[EBP-offset-4(n+1)]访问该变量。由于本实验中将所有的形参都视为了局部变量,所以对访问作出了一定程度的简化处理,即只需要利用[EBP-offset]访问变量即可。假设我们有两个寄存器,z 为局部变量,在符号表中 offset 为 8,用 pushad 保护 z 寄存器,则对应代码为 mov [ebp-8], eax。

需要特殊处理的是临时变量。有的临时变量计算出来后接着被使用,且在后续代码中不活跃,这种临时变量无需存入栈帧,也有的临时变量计算出来后要等后面使用,如果寄存器数量不足,可能就需要存入栈帧,因此需要为其分配一个地址单元。在中间代码生成中,已经在符号表中保存了一个过程的总体偏移量 offset,它就是一个过程中所有局部变量占用空间的总和。这个偏移量加上保存的寄存器空间,就是临时变量保存的起始空间,它等于运行时的 ESP,但现在生成代码是编译时,需要记录下每个临时变量的地址,供后续访问使用。即当遇到需要保存的局部变量时,先从符号表查询到这个符号,如果该变量还未分配空间,则将临时变量起始空间作为当前临时变量地址并存入符号表,然后生成代码开辟这个空间再将地址偏移量返回。

而本实验对分配或获得一个临时变量的存储地址亦作出了一定程度的简化,在需要存入临时变量时按序依次将临时变量在局部变量之后的栈帧中开辟空间即可,可以像局部变量一样通过[EBP-offset]访问这个地址。

对寄存器的数量和名字我们也作一定程度的简化处理,数量我们约定为三个,名字约定为 R0、R1 和 R2。分配寄存器也作简化,先分配 R0,再分配 R1,再分配 R2,顺序分配。

待用信息和活跃信息的生成
对于一个四元式的每个变量,都有一个待用信息,它包括两方面的信息:

后续引用点(USE):在当前基本块中,该变量后续被引用的四元式编号。
活跃信息(LIVE):后续该变量是否活跃。
因此,待用信息用一个二元组(USE, LIVE)去表示,没有引用点的 USE 用 - 表示。

待用信息求解的结果是为每个四元式的每个变量求一个二元组(USE, LIVE),这些信息被附加在中间代码上,即为中间代码的每个四元式的每个变量增加这样两个属性。在求解活跃信息时,由于所有变量都被登记在符号表中,因此只需在符号表中为每个变量增加两个域,即 USE 和 LIVE。初始时将符号表中个变量的 USE 设置为非待用,LIVE 则根据基本块出口是否活跃设置。本实验中,把基本块中所有临时变量均看作基本块出口之后的非活跃变量,而把所有非临时变量看作基本块出口之后的活跃变量。

在基本块的出口处,活跃变量存入主存中时依照字典序存入。

寄存器和地址描述符
每个可用的寄存器都有一个寄存器描述符 Rval,它是一个集合,用来记录哪些变量的值存放在此寄存器中。你可以用 Rval(R0)表示寄存器 R0 中保存的变量,基本块级别的代码生成,初始可以将所有寄存器描述符置空。

而每个变量都有一个地址描述符 Aval,它可以被记录在符号表中,也是一个集合,用来记录标记变量的值是存放在寄存器还是内存中。

目标代码的映射
各四元式对应的目标代码(注意在本实验中整型和浮点的运算不作区分):

contact me on help-assignment

  • 10
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值