计算机系统结构 流水线及流水线中的冲突

一、实验目的

(1)加深对计算机流水线基本概念的理解。

(2)理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作。

(3)加深对数据冲突、结构冲突和控制冲突的理解,理解这三类类冲突对CPU性能的影响。

、实验环境

实验平台采用指令级和流水线操作级模拟器MIPSsim

三、实验内容和实验步骤

首先要掌握MIPSsim模拟器的使用方法。

(1)启动MIPSsim模拟器。

(2)理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容)

(3)熟悉MIPSsim模拟器的操作和使用方法。

可以先载入一个样例程序,然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。

(4)选择配置菜单中的“流水方式”选项,使模拟器工作于流水方式下。

(5)观察程序在流水线中的执行情况,步骤如下:

①选择MIPSsim的“文件”->“载入程序”选项来加载pipeline.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

②关闭定向功能。这是通过“配置”->“定向”(使该项前面没有√号)来实现的。

③用单步执行一个周期的方式(在“执行”菜单中)或按F7键执行该程序,观察每一个周期中,各段流水寄存器内容的变化、指令的执行情况(“代码”窗口)以及时钟周期图。

④当执行到第13个时钟周期时,各段分别正在处理的指令是:

IF:       LW r4,60(r6)取指     

ID:     ADDI r3,r0,25 读寄存器

EX:       ADDI r1,r1,-1 执行   

MEM:     ADDI ,r6,r0,8 访存   

WB:     ADD r2,r1,$r0 回写    

画出这时的时钟周期图。

 

(6)这时各流水寄存器中的内容为,

IF/ID. IR::    0X8CC4003C 机器码 ; 

IF/ID. NPC: 0X00000030 下一条地址; 

ID/EX. A:          0            ; 

ID/EX. B:          0            ; 

ID/EX. Imm:       25            ; 

ID/EX. IR:        0X20030019     

EX/MEM. ALUo:         4       

EX/MEM. IR:     0X2021FFFF     ; 

MEM/WB. LMD:         0        ; 

MEM/WB. ALUo:        8        ; 

MEM/WB. IR:     0X20060008     

  1. 观察和分析结构冲突对CPU性能的影响,步骤如下:

①加载structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

②执行该程序,找出存在结构冲突的指令对以及导致结构冲突的部件。

存在结构冲突的指令:   fadd    ;导致结构冲突的部件: 浮点加法器   

③记录由结构冲突引起的停顿时钟周期数为     35         ,计算停顿时钟周期数占总执行周期数的百分比为    67.30769%       

④把浮点加法器的个数改为4个(在菜单"配置"à"常规配置"中修改浮点部件个数)。

⑤再次重复步骤①~③的工作。

记录由结构冲突引起的停顿时钟周期数为19,计算停顿时钟周期数占总执行周期数的百分比为   42.10526%          

⑥分析结构冲突对CPU性能的影响,讨论解决结构冲突的方法。

答:结构冲突对CPU性能的影响: 当发生冲突时,流水线会出现停顿从而降低CPU的性能。解决结构冲突的方法: 在流水线处理机中设置相互独立的指令寄存器和数据寄存器。

(8)观察数据冲突并用定向技术来减少停顿,步骤如下:

①全部复位。

②加载data_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

③关闭定向功能。

④用单步执行一个周期的方式执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。

Cycle4,6,7,9,10,13,14,17,18,20,21,25,26,28,29,32,33,36,37,39,40,44,45,47,48,51,52,55,56,58,59时,发生RAW冲突

⑤记录数据冲突引起的停顿时钟周期数为 31 以及程序执行的总时钟周期为65,计算停顿时钟周期数占总执行周期数的百分比   47.69231%  

⑥复位CPU。

⑦打开定向功能。这是通过“配置”->“定向”(使该项前面有√号)来实现的。

⑧用单步执行一个周期的方式执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突,并与步骤④的结果进行比较。

在第 5,9,13,17,21,25,29,33,37 时钟周期发生了RAW冲突,可以看到,通过 定向 技术,大大减少了RAW冲突数目。

⑨记录数据冲突引起的停顿时钟周期数 9以及程序执行的总时钟周期数 43 。计算采用定向技术后的性能是原来的 1.51 倍。

(9)用指令调度技术解决流水线中的数据冲突。

①全部复位。

②加载schedule.s(在模拟器所在文件夹下的“样例程序”文件夹中)。

③关闭定向功能。

④执行所载入的程序。通过查看统计数据和时钟周期图,找出并记录程序执行过程中各种冲突发生的次数 16 、发生冲突的指令组合 TEQ$r0,$r0  以及程序执行的总时钟周期数 33  

⑤采用指令调度技术对程序进行指令调度,消除冲突。将调度后的程序存到after-schedule.s中。

⑥载入after-schedule.s。

⑦执行该程序。观察程序在流水线中的执行情况,记录程序执行的总时钟周期数 19  

⑧根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU性能的作用。

指令调度后时钟周期数从33降到19,指令调度使指令顺序重新组合,可以消除部分的数据冲突,从而通过指令调度技术显著提高了CPU使用率,大大减少了指令冲突次数,提高了CPU的性能

(10)用延迟分支减少分支指令对性能的影响。

①全部复位。

②载入branch.s。

③关闭延迟分支功能。这是通过“配置”->“延迟槽”(使该项前面无√号)选项来实现的。

④执行该程序。观察并记录发生分支延迟的时刻。

⑤记录执行该程序所用的总时钟周期数      38    

⑥假设延迟槽为一个,对branch.s进行指令调度,然后保存到“delayed-branch.s”中。

⑦载入delayed-branch.s。

⑧打开延迟分支功能。这是通过“配置”->“延迟槽”选项来实现的。

⑨执行该程序。观察其时钟周期图。

 

⑩记录执行该程序所用的总时钟周期数。25

⑪对比上述两种情况下的时钟周期图。

⑫根据记录结果,比较没采用延迟分支和采用了延迟分支的性能之间的不同。论述延迟分支对于提高CPU性能的作用。

    答:没有采用分支延迟的周期总数为38,采用后为25,可知在使用延迟槽后,指令在运行到跳转指令时不会出现延迟等待,则能提高CPU的性能。所以只要分支延迟槽中的指令是够用的,流水线中就没有停顿,这时延迟分支的方法就能很好的减少分支延迟。所以放入延迟槽中的指令很重要。对CPU性能影响很显著。

  • 8
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值