2.1实验目的
(1)加深对计算机流水线基本概念的理解。
(2)理解 MIPS结构如何用 5段流水线来实现理解各段的功能和基本操作。
(3)加深对数据冲突结构冲突的理解,理解这两类冲突对 CPU性能的影响。
(4)进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。
2.2实验平台
实验平台采用指令级和流水线操作级模拟器MIPSsim。
2.3实验内容和实验截图
首先要掌握 MIPSsim 模拟器的使用方法(见1.4 节)。
(1)启动 MIPSsim。
(2)根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(双击各段就可以看到各流水寄存器的内容)
(3)参照实验 1.4 节的使用说明,熟悉 MIPSim 模拟器的操作和使用方法
可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察 CPU 中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。
(4)选择配置菜单中的“流水方式”,使模拟器工作于流水方式下
(5)观察程序在流水线中的执行情况,步骤如下。
①选择MIPSsim的“文件”-“载人程序”选项来加载 pipeline.s(在模器所在文件夹下的“样例程序”文件夹中)。
②关闭定向功能。这是通过选择“配置”-“定向”(使该项前面没有√号)来实现的。
③用单步执行一周期的方式(“执行”菜单中)或用 F7 键执行该程序,观察每一周期中,各段流水寄存器内容的变化、指令的执行情况(“代码”窗口),以及时钟周期图。
④当执行到第 13 个时钟周期时,各段分别正在处理的指令是:
IF:LWR4,60(R6)取指
ID:ADDIr3,r0,25读寄存器
EX:ADDIr1,r1,-1执行
MEM:ADDIr6,r0,8访存
WB:ADDr2,r1,$r0回写
画出此时的时钟周期图
(6)这时各流水寄存器中的内容为:
IF/ID.IR: 2361655356
IF/ID.NPC: 48
ID/EX.A: 0
ID/EX.B: 0
ID/EX.Imm: 25
ID/EX.IR: 537067545
EX/MEM.ALUo: 4
EX/MEM.IR: 539099135
MEM/WB.LMD: 0
MEM/WB.ALUo: 8
MEM/WB.IR: 537264136
(7)观察和分析结构冲突对 CPU性能的影响,步骤如下。
①加载 structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
②执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件。
存在结构冲突的指令:fadd
导致结构冲突的部件:浮点加法器
③记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期的百分比。
由结构冲突引起的停顿时钟周期数为
35个
停顿时钟周期数占总执行周期的百分比为76.08696%
④把浮点加法器的个数改为 4 个(在菜单"配置"à"常规配置"中修改浮点部件个数)
⑤再次重复上述1~3的工作。
由结构冲突引起的停顿时钟周期数为:
2个
停顿时钟周期数占总执行周期数的百分比:
10.53632%
⑥分析结构冲突对 CPU性能的影响,讨论解决结构冲突的方法
结构冲突对CPU性能的影响:当发生冲突时,流水线会出现停顿从而降低CPU的性能。
解决结构冲突的方法:
解决一:暂停一个时钟周期,取后一条指令操作;
解决二:设置两个独立的存储器分别存放操作数和指令。
(8)观察数据冲突并用定向技术来减少停顿,步骤如下。
①全部复位。
②加载 data_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
③关闭定向功能。这是通过选择“配置”-“定向”(使该项前面没有√号)来实
现的。
④用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。
在第 4、6、7、9、10、13、14、17、18、20、21、25、26、28、29、32、33、36、37、39、40、44、45、47、48、51、52、55、56、58、59 时钟周期发生了RAW冲突,可以看到,通过定向技术,大大减少了RAW冲突数目。
。
⑤记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。
数据冲突引起的停顿时钟周期数 26 以及程序执行的总时钟周期数 51 。停顿时钟周期数占总执行周期数的百分比50.98039%
⑥复位CPU。
⑦打开定向功能。这是通过选择“配置”一“定向”(使该项前面有一个√号)来实现的。
⑧用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了 RAW(先写后读)冲突,并与3的结果进行比较。
在5、10、13、18、22、25、30、34、37时刻发生了 RAW(先写后读)冲突。
⑨记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算采用定向技术后性能提高的倍数。
数据冲突引起的停顿时钟周期数3 以及程序执行的总时钟周期数13。计算采用定向技术后的性能是原来的1.51倍。