【计算机体系结构实验】流水线及流水线中的冲突

实验二 流水线及流水线中的冲突

实验目的

  • 加深对计算机流水线基本概念的理解。
  • 理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作。
  • 加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响。
  • 进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。

实验平台

实验平台采用指令级和流水线操作级模拟器MIPSsim。

实验内容和步骤

一 首先要掌握MIPSsim模拟器的使用方法

(1) 启动MIPSsim。

(2) 根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容)

(3)参照MIPSsim模拟器使用说明,熟悉MIPSsim模拟器的操作和使用方法。
可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中)。然后分别以单步执行一条周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。

(4)选择配置菜单中的“流水方式”选项,使模拟器工作于流水方式下。

(5)观察程序在流水线中的执行情况,步骤如下:
1)选择MIPSsim的“文件”—>“载入程序”选项来加载pipeline.s (在模拟器所在文件夹下的“样例程序”文件夹中)。
2)关闭定向功能。这是通过“配置”—>“定向”(使该项前面没有√号)来实现的。
3)用单步执行一个周期的方式(在“执行”菜单中)或按F7键执行该程序,观察每一个周期中,各段流水寄存器内容的变化、指令的执行情况(“代码”窗口)以及时钟周期图。
4)当执行到第13个时钟周期时,各段分别正在处理的指令是:
IF: LW r 4 , 60 ( r4,60( r4,60(r6) 取指
ID: ADDI r 3 , r3, r3,r0,25 读寄存器
EX: ADDI r 1 , r1, r1,r1,-1 执行
MEM: ADDI r 6 , r6, r6,r0,8 访存
WB: ADD r 2 , r2, r2,r1,$r0 回写
画出这时的时钟周期图。
在这里插入图片描述

(6)这时各流水寄存器中的内容为:
IF/ID.IR: 0X8CC4003C 机器码
IF/ID.NPC: 0X00000030 下一条地址
ID/EX.A: 0
ID/EX.B: 0
ID/EX.Imm: 25
ID/EX.IR: 0X20030019
EX/MEM.ALUo: 4
EX/MEM.IR: 0X2021FFFF
MEM/WB.LMD: 0
MEM/WB.ALUo: 8
MEM/WB.IR: 0X20060008

(7)观察和分析结构冲突对CPU性能的影响,步骤如下:
1)加载structure_hz.s(在模拟器所在文件夹下的“样例程序”文件夹中)。
2)执行该程序,找出存在结构冲突的指令fadd, 对以及导致结构冲突的部件 浮点加法器 。
3)记录由结构冲突引起的停顿时钟周期数,计算停顿时钟周期数占总执行周期数的百分比: 总周期数52个,结构停顿周期数35个,占总执行周期数的67.30769% 。
4)把浮点加法器的个数改为4个。
5)再次重复步骤①~③的工作。
6)分析结构冲突对CPU性能的影响,讨论解决结构冲突的方法。
答:结构冲突对CPU性能的影响: 当发生冲突时,流水线会出现停顿从而降低CPU的性能。 。
解决结构冲突的方法: 在流水线处理机中设置相互独立的指令寄存器和数据寄存器。 。

(8)观察数据冲突并用定向技术来减少停顿,步骤如下:
1)全部复位。
2)加载data_hz.s(在模拟器所在的文件夹下的“样例程序”文件夹中)。
3)关闭定向功能。这是通过“配置”->“定向”(是该项前面没有√号)来实现的。
4)用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突。
答:在Cycle 4, 6, 7, 9, 10, 13, 14, 17, 18, 20, 21, 25, 26, 28, 29, 32, 33, 36, 37, 39, 40, 44, 45, 47, 48, 51, 52, 55, 56, 58, 59 时,发生RAW冲突。
5)记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数,计算停顿时钟周期数占总执行周期数的百分比。
答:数据冲突引起的停顿时钟周期数为: 31 ,程序执行的总时钟周期数为: 65 ,停顿时钟周期数占总执行周期数的百分比为 47.69231%
6)复位CPU 。
7)打开定向功能。这是通过“配置”->“定向”(是该项前面有√号)来实现的。
8)用单步执行一个周期的方式(F7)执行该程序,同时查看时钟周期图,列出在什么时刻发生了RAW(先写后读)冲突,并与步骤3的结果进行比较。
答:在第 5,9,13,17,21,25,29,33,37 时钟周期发生了RAW冲突,可以看到,通过 定向 技术,大大减少了RAW冲突数目。
9)记录数据冲突引起的停顿时钟周期数以及程序执行的总时钟周期数。计算采用定向技术后的性能是原来的几倍。
答:数据冲突引起的停顿周期数为: 9 ,程序的总时钟周期数为: 43 ,停顿时钟周期数占总执行周期数的百分比为 20.93023% ,采用定向技术后的性能是原来的 1.51 倍。

  • 25
    点赞
  • 128
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

莫余

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值