Tomasulo算法的基本思想请看这篇文章:计算机体系结构-Tomasulo算法
本篇文章主要采取Tomasulo算法模拟器周期步进的方法来对指令段依次解读,想要自己使用模拟器来对特定程序段进行分布查看的小伙伴也可以自己下一个。想直接要实验报告的请直接移步至最后。
假设浮点功能部件的延迟时间为:加减法2个时钟周期,乘法10个时钟周期,除法40个时钟周期,Load部件2个时钟周期。
① 对于下面的代码段,给出当指令MUL.D即将写回时,保留站、Load缓冲器以及寄存器状态表中的内容。
L.D F6, 24(R2)
L.D F2, 12(R3)
MUL.D F0, F2, F4
SUB.D F8, F6, F2
DIV.D F10, F0, F6
ADD.D F6, F8, F2
②按步进方式执行上述代码,利用模拟器的“小三角按钮”的对比显示功能,观察每一个时钟周期前后各信息表中内容的变化情况。
周期1:取出第一条指令L.D F6, 24(R2),地址偏移量24写入LOAD部件中的LOAD1并且将LOAD1名存入寄存器字段F6中。
周期2:取出第二条指令L.D F2, 12(R3),地址偏移量12写入LOAD部件中的LOAD2并且将LOAD2名存入寄器字段F2中,同时第一条指令开始执行,LOAD1上写入绝对地址。
周期3:取出第三条指令MUL.D F0, F2,F4,第一条指令完成取值并且准备在下一个时钟周期写入寄存器F6,第二条指令开始执行,LOAD2上写入绝对地址。同时,保留站中存入第三条指令待运算的操作数和操作,因为F2中内容需要Load,所以先写进保留站的Qj中,F4可以直接取就直接存进Vk中。寄存器F0中Qi写入保留站中待运算命令的名称。
周期4:取出第四条指令SUB.D F8,F6,F2,第二条指令执行完成,同时第一条指令完成写入结果M1到寄存器表F6中的值并在指令状态表中第一条指令填入写结果周期4。同样在保留站中存入第四条指令的待运算操作数和操作,F6是之前写入的值为M1所以存入Vj,F2是要等待Load的值尚未准备好所以存入Qk中为Load2,同时寄存器表中F8中Qi存入将要给它赋值的指令名称。Load部件中LOAD1行清空。
周期5:取出第五条指令DIV.D F10,F0,F6,第二条指令写结果M2到寄存器F2的值中,Load部件表中LOAD2行清空。同时,因为F2的值M2已经准备好了,所以在保留站中第一行的Qk转为Vk为M2,同理第四行。保留站中继续存入第五条指令的待运算操作数和操作,因为F0需要Mult1的值,所以保留站最后一行Qj先填入对应寄存器指令名称。
周期6:取出第六条指令ADD.D F6,F8,F2,因为所需数据都已经在之前的周期中写回结果,所以第三条和第四条指令在第六个周期开始执行并在指令状态中更新,相关的操作数和操作符被存入保留站,同理因为F8的结果正在由Sub执行,所以Qj先写为Sub所在的保留站Add1,同时在寄存器表中F6(第六条指令将要写入的寄存器)的改变Qi为指令执行的保留站号Add2。然后因为SUB和MULT都已经取到值了,可以开始执行了,就分别更新保留站之中的time列。
周期7:因为SUB只需2个周期就可以执行完,所以SUB的Time由上个周期的1变成2时就代表指令完成,故第四条SUB指令执行完成,更新指令状态,并且准备写入寄存器表中Qi为Add1的寄存器中,即F8。保留站中的MULT指令继续执行,DIV指令继续等待MULT。
周期8:SUB指令执行完后在下个周期写结果M3到寄存器F8,同时保留站Add1中存放的指令的位置清空,MULT条指令继续执行。因为F8也有了ADD所需要的数据,所以更新Add2中的Vj为M3
周期9:ADD(第六条)指令开始执行。MULT指令继续执行。 周期10:ADD指令执行完成在下个周期准备写结果到F6,MULT指令继续执行。
周期11:ADD指令写结果M4到寄存器F6中,清空保留站中原来存放ADD指令的位置。MULT指令继续执行。
周期12~15:MULT指令继续执行,直到完成。周期16:MULT指令写结果M5到寄存器F0,保留站中原来存放指令的位置清空。
周期17~56:DIV指令开始执行,直到执行完毕。周期57:第五条指令执行结束后写结果M6到F10,保留站中原来存放指令的位置清空,执行完毕。
假设浮点功能部件的延迟为:加减法3个时钟周期,乘法8个时钟周期,除法40个时钟周期。自己编写一段程序(要在实验报告中给出),重复上述步骤 。
该部分详情见实验报告:https://download.csdn.net/download/weixin_56213139/87149418