2.1 实验目的
- 加深对计算机流水线基本概念的理解。
- 理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作。
- 加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响。
- 进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。
2.2 实验平台
实验平台采用指令级和流水线操作级模拟器MIPSsim。
2.3 实验内容和步骤
首先要掌握MIPSsim模拟器的使用方法。详见附录B。
1.启动MIPSsim。
2.根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容)
3.熟悉MIPSsim模拟器的操作和使用方法。
可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。
4.选择配置菜单中的“流水方式”,使模拟器工作于流水方式下。
5.观察程序在流水线中的执行情况,步骤如下:
1)选择MIPSsim的“文件”→“载入程序”选项来加载pipeline.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
2)关闭定向功能。这是通过在“配置”→“定向”(使该项前面没有“√”号)来实现的。
3)用单步执行一周期的方式(“执行”菜单中)或用F7执行该程序,观察每一周期中,各段流水寄存器内容的变化、指令的执行情况(“代码”窗口)以及时钟周期图。
4)当执行到第13个时钟周期时,各段分别正在处理的指令是:
IF:LWR4,60(R6)取指
ID:ADDIr3,r0,25读寄存器
EX:ADDIr1,r1,-1执行
MEM:ADDIr6,r0,8访存
WB:ADDr2,r1,$r0回写
5)画出这时的流水线图和时钟周期图。
(6)、这时各流水寄存器中的内容为(这里按16进制,图为十进制):
IF/ID.IR:0X8CC4003C机器码
IF/ID.NPC:0X00000030下一条地址
ID/EX.A:0
ID/EX.B:0
ID/EX.IR:25
ID/EX.Imm:0X20030019
EX/MEM.ALUo:4
EX/MEM.IR:0X2021FFFF
MEM/WB.LMD:0
MEM/WB.ALUo:8
MEM/WB.IR:0X20060008
(7)、观察和分析结构冲突对CPU性能的影响,步骤如下:
- 加载structure_hz.s。
2)执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件。
指令fadd;部件是浮点加法器
3)记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。
总周期数52个,结构停顿周期数35个,占总执行周期数的67.30769%
4)把浮点加法器的个数改为4个。
- 再次重复步骤1)-步骤3)的工作。
6)分析结构冲突对CPU性能的影响,讨论解决结构冲突的方法。
解决一:暂停一个时钟周期,取后一条指令操作;
解决二:设置两个独立的存储器分别存放操作数和指令,
还可以采取指令预存技术;
(8)、观察数据冲突并用定向技术来减少停顿,步骤如下:
1)全部复位。
- 加载data_hz.s。
3)关闭定向功能。
4)单步执行一个周期,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。
4、6、7、9、10、13、14、17、18、20、21、25、26、28、29、32、33、36、37、39、40、44、45、47、48、51、52、55、56、58、59(太多,不一一截图了)
5)记录数据冲突引起的停顿时钟周期数及程序执行的总时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。
6)复位CPU。
- 打开定向功能。
8)单步执行一个周期,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突,并与步骤(3)的结果进行比较。
51013182225303437
9)记录由数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算采用定向技术后的性能是原来的几倍。
65/43=1.51倍