计算机体系结构||流水线及流水线中的冲突(2)

2.1实验目的

(1)加深对计算机流水线基本概念的理解。

(2)理解 MIPS结构如何用 5段流水线来实现理解各段的功能和基本操作。

(3)加深对数据冲突结构冲突的理解,理解这两类冲突对 CPU性能的影响。

(4)进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。

2.2实验平台

实验平台采用指令级和流水线操作级模拟器MIPSsim。

2.3实验内容和实验截图

首先要掌握 MIPSsim 模拟器的使用方法(见1.4 节)。

(1)启动 MIPSsim。

(2)根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(双击各段就可以看到各流水寄存器的内容)

(3)参照实验 1.4 节的使用说明,熟悉 MIPSim 模拟器的操作和使用方法

可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察 CPU 中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。

(4)选择配置菜单中的“流水方式”,使模拟器工作于流水方式下

(5)观察程序在流水线中的执行情况,步骤如下。

①选择MIPSsim的“文件”-“载人程序”选项来加载 pipeline.s(在模器所在文件夹下的“样例程序”文件夹中)。

②关闭定向功能。这是通过选择“配置”-“定向”(使该项前面没有√号)来实现的。

③用单步执行一周期的方式(“执行”菜单中)或用 F7 键执行该程序,观察每一周期中,各段流水寄存器内容的变化、指令的执行情况(“代码”窗口),以及时钟周期图。

④当执行到第 13 个时钟周期时,各段分别正在处理的指令是:

IF:LWR4,60(R6)取指

ID:ADDIr3,r0,25读寄存器

EX:ADDIr1,r1,-1执行

MEM:ADDIr6,r0,8访存

WB:ADDr2,r1,$r0回写

画出此时的时钟周期图

(6)这时各流水寄存器中的内容为:

IF/ID.IR: 2361655356

IF/ID.NPC: 48

ID/EX.A: 0

ID/EX.B: 0

ID/EX.Imm: 25

ID/EX.IR: 537067545

EX/MEM.ALUo: 4

EX/MEM.IR: 539099135

MEM/WB.LMD: 0

MEM/WB.ALUo: 8

MEM/WB.IR: 537264136

(7)观察和分析结构冲突对 CPU性能的影响,步骤如下。

①加载 structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

②执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件。

存在结构冲突的指令:fadd

导致结构冲突的部件:浮点加法器

③记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期的百分比。

由结构冲突引起的停顿时钟周期数为

35个

停顿时钟周期数占总执行周期的百分比为76.08696%

④把浮点加法器的个数改为 4 个(在菜单"配置"à"常规配置"中修改浮点部件个数

⑤再次重复上述1~3的工作。

由结构冲突引起的停顿时钟周期数为

2个

停顿时钟周期数占总执行周期数的百分比

10.53632%

⑥分析结构冲突对 CPU性能的影响,讨论解决结构冲突的方法

结构冲突对CPU性能的影响当发生冲突时,流水线会出现停顿从而降低CPU的性能。

解决结构冲突的方法:

解决一:暂停一个时钟周期,取后一条指令操作;

解决二:设置两个独立的存储器分别存放操作数和指令

(8)观察数据冲突并用定向技术来减少停顿,步骤如下。

①全部复位。

②加载 data_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

③关闭定向功能。这是通过选择“配置”-“定向”(使该项前面没有√号)来实

现的。

④用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。

在第 4、6、7、9、10、13、14、17、18、20、21、25、26、28、29、32、33、36、37、39、40、44、45、47、48、51、52、55、56、58、59 时钟周期发生了RAW冲突,可以看到,通过定向技术大大减少了RAW冲突数目。

⑤记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。

数据冲突引起的停顿时钟周期数 26 以及程序执行的总时钟周期数 51 停顿时钟周期数占总执行周期数的百分比50.98039%

⑥复位CPU。

⑦打开定向功能。这是通过选择“配置”一“定向”(使该项前面有一个√号)来实现的。

⑧用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了 RAW(先写后读)冲突,并与3的结果进行比较。

在5、10、13、18、22、25、30、34、37时刻发生了 RAW(先写后读)冲突。

⑨记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算采用定向技术后性能提高的倍数。

数据冲突引起的停顿时钟周期数3 以及程序执行的总时钟周期数13。计算采用定向技术后的性能是原来的1.51倍。

  • 24
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值