计算机系统结构流水线及流水线中的冲突

最新推荐文章于 2023-12-10 07:56:15 发布

清水12

最新推荐文章于 2023-12-10 07:56:15 发布

阅读量2.7k

点赞数 8

文章标签：汇编

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WSY_12345/article/details/130492915

版权

一、实验目的

（1）加深对计算机流水线基本概念的理解。

（2）理解MIPS结构如何用5段流水线来实现，理解各段的功能和基本操作。

（3）加深对数据冲突、结构冲突和控制冲突的理解，理解这三类类冲突对CPU性能的影响。

二、实验环境

实验平台采用指令级和流水线操作级模拟器MIPSsim

三、实验内容和实验步骤

首先要掌握MIPSsim模拟器的使用方法。

（1）启动MIPSsim模拟器。

（2）理解流水线窗口中各段的功能，掌握各流水寄存器的含义。（用鼠标双击各段，就可以看到各流水寄存器的内容）

（3）熟悉MIPSsim模拟器的操作和使用方法。

可以先载入一个样例程序，然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序，观察程序的执行情况，观察CPU中寄存器和存储器的内容的变化，特别是流水寄存器内容的变化。

（4）选择配置菜单中的“流水方式”选项，使模拟器工作于流水方式下。

（5）观察程序在流水线中的执行情况，步骤如下：

①选择MIPSsim的“文件”->“载入程序”选项来加载pipeline.s（在模拟器所在文件夹下的“样例程序”文件夹中）。

②关闭定向功能。这是通过“配置”->“定向”（使该项前面没有√号）来实现的。

③用单步执行一个周期的方式（在“执行”菜单中）或按F7键执行该程序，观察每一个周期中，各段流水寄存器内容的变化、指令的执行情况（“代码”窗口）以及时钟周期图。

④当执行到第13个时钟周期时，各段分别正在处理的指令是：

IF: LW r4,60(r6)取指；

ID: ADDI r3,r0,25 读寄存器；

EX: ADDI r1,r1,-1 执行；

MEM: ADDI ,r6,r0,8 访存；

WB: ADD r2,r1,$r0 回写；

画出这时的时钟周期图。

（6）这时各流水寄存器中的内容为，

IF/ID. IR:: 0X8CC4003C 机器码；

IF/ID. NPC: 0X00000030 下一条地址；

ID/EX. A: 0 ；

ID/EX. B: 0 ；

ID/EX. Imm: 25 ；

ID/EX. IR: 0X20030019 ；

EX/MEM. ALUo: 4 ；

EX/MEM. IR: 0X2021FFFF ；

MEM/WB. LMD: 0 ；

MEM/WB. ALUo: 8 ；

MEM/WB. IR: 0X20060008 ；

观察和分析结构冲突对CPU性能的影响，步骤如下：

①加载structure_hz.s（在模拟器所在文件夹下的“样例程序”文件夹中）。

②执行该程序，找出存在结构冲突的指令对以及导致结构冲突的部件。

存在结构冲突的指令： fadd ；导致结构冲突的部件：浮点加法器；

③记录由结构冲突引起的停顿时钟周期数为 35 个，计算停顿时钟周期数占总执行周期数的百分比为 67.30769% 。

④把浮点加法器的个数改为4个（在菜单"配置"à"常规配置"中修改浮点部件个数）。

⑤再次重复步骤①~③的工作。

记录由结构冲突引起的停顿时钟周期数为19，计算停顿时钟周期数占总执行周期数的百分比为 42.10526% 。

⑥分析结构冲突对CPU性能的影响，讨论解决结构冲突的方法。

答：结构冲突对CPU性能的影响：当发生冲突时，流水线会出现停顿从而降低CPU的性能。解决结构冲突的方法：在流水线处理机中设置相互独立的指令寄存器和数据寄存器。

（8）观察数据冲突并用定向技术来减少停顿，步骤如下：

①全部复位。

②加载data_hz.s（在模拟器所在文件夹下的“样例程序”文件夹中）。

③关闭定向功能。

④用单步执行一个周期的方式执行该程序，同时查看时钟周期图，列出在什么时刻发生了RAW（先写后读）冲突。

Cycle4,6,7,9,10,13,14,17,18,20,21,25,26,28,29,32,33,36,37,39,40,44,45,47,48,51,52,55,56,58,59时，发生RAW冲突

⑤记录数据冲突引起的停顿时钟周期数为 31 以及程序执行的总时钟周期为65，计算停顿时钟周期数占总执行周期数的百分比 47.69231% 。

⑥复位CPU。

⑦打开定向功能。这是通过“配置”->“定向”（使该项前面有√号）来实现的。

⑧用单步执行一个周期的方式执行该程序，同时查看时钟周期图，列出在什么时刻发生了RAW(先写后读)冲突，并与步骤④的结果进行比较。

在第 5,9,13,17,21,25,29,33,37 时钟周期发生了RAW冲突，可以看到，通过定向技术，大大减少了RAW冲突数目。

⑨记录数据冲突引起的停顿时钟周期数 9以及程序执行的总时钟周期数 43 。计算采用定向技术后的性能是原来的 1.51 倍。

（9）用指令调度技术解决流水线中的数据冲突。

①全部复位。

②加载schedule.s（在模拟器所在文件夹下的“样例程序”文件夹中）。

③关闭定向功能。

④执行所载入的程序。通过查看统计数据和时钟周期图，找出并记录程序执行过程中各种冲突发生的次数 16 、发生冲突的指令组合 TEQ$r0,$r0 以及程序执行的总时钟周期数 33 。

⑤采用指令调度技术对程序进行指令调度，消除冲突。将调度后的程序存到after-schedule.s中。

⑥载入after-schedule.s。

⑦执行该程序。观察程序在流水线中的执行情况，记录程序执行的总时钟周期数 19 。

⑧根据记录结果，比较调度前和调度后的性能。论述指令调度对于提高CPU性能的作用。

指令调度后时钟周期数从33降到19，指令调度使指令顺序重新组合，可以消除部分的数据冲突，从而通过指令调度技术显著提高了CPU使用率，大大减少了指令冲突次数，提高了CPU的性能

（10）用延迟分支减少分支指令对性能的影响。

①全部复位。

②载入branch.s。

③关闭延迟分支功能。这是通过“配置”->“延迟槽”（使该项前面无√号）选项来实现的。

④执行该程序。观察并记录发生分支延迟的时刻。

⑤记录执行该程序所用的总时钟周期数 38 。

⑥假设延迟槽为一个，对branch.s进行指令调度，然后保存到“delayed-branch.s”中。

⑦载入delayed-branch.s。

⑧打开延迟分支功能。这是通过“配置”->“延迟槽”选项来实现的。

⑨执行该程序。观察其时钟周期图。

⑩记录执行该程序所用的总时钟周期数。25

⑪对比上述两种情况下的时钟周期图。

⑫根据记录结果,比较没采用延迟分支和采用了延迟分支的性能之间的不同。论述延迟分支对于提高CPU性能的作用。

答：没有采用分支延迟的周期总数为38，采用后为25，可知在使用延迟槽后，指令在运行到跳转指令时不会出现延迟等待，则能提高CPU的性能。所以只要分支延迟槽中的指令是够用的，流水线中就没有停顿，这时延迟分支的方法就能很好的减少分支延迟。所以放入延迟槽中的指令很重要。对CPU性能影响很显著。

关注

8
点赞
踩
51

收藏

觉得还不错? 一键收藏
0
评论
计算机系统结构流水线及流水线中的冲突

实验二流水线及流水线中的冲突
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。