发射过程中的流水线

newyork major

已于 2023-12-18 11:35:57 修改

阅读量431

点赞数 6

分类专栏： risc-v 文章标签： risc-v

于 2023-12-18 11:34:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangshangjie1/article/details/135058018

版权

risc-v 专栏收录该内容

61 篇文章 6 订阅

订阅专栏

本文讨论了一种非数据捕捉结构的流水线，涉及指令队列中指令的执行条件，包括源操作数准备、仲裁和唤醒过程。重点介绍了通过旁路网络和PRF实现提前唤醒，以及如何优化发射过程以减少硬件资源消耗。

摘要由CSDN通过智能技术生成

非数据捕捉结构的流水线
- 此种数据结构中，issue queue中的指令，要被FU执行，需要等到一下几个条件都成立：
  - 这条指令所有的源操作数都准备好了；
  - 这条指令能够从发射队列中被选中,即需要经过仲裁电路的允许才能够进行发射;
  - 需要能够从寄存器、payload RAM或者旁路网络(bypassing network)中获得源操作数的值。
- 这三个条件是顺序发生的；
- wakeup: 源寄存器从没有准备好的状态，变成准备好的状态；
  - 实现方式：通过bypass网络，或者PRF, 通知IQ中的每个源寄存器；
  - 发射过程，最典型的流水线划分，就是wakeup和select;
- wakeup的提前
  - 通过处理器中的旁路网络(bypassing network)，能够使唤醒的过程提前。
  - 当指令 B 到达执行阶段(execute)的时候，可以从旁路网络中得到指令A 的结果,此时指令B就可以顺利地进入到FU中执行了；
  - 需要注意的是上述的这个过程,是在一个周期之内先使用仲裁电路从发射队列中选择出一条合适的指令(这是仲裁阶段的工作),然后再将发射队列中相关的寄存器置为准备好的状态(这是唤醒阶段的工作)，这里是有先后顺序的；
  - 即：selcet和wakeup组成了一个原子操作；
  - 如果分成两个周期，则：
  - 在一般的指令集中，不同的指令需要的执行周期数是不一样的，普通的加减法、逻辑运算等比较简单的操作，需要一个周期就可以了，而乘除法这样的操作需要多个周期，还有比较特殊的 load 操作，其执行的周期数取决于 D-Cache（或 StoreBuffer)是否命中等，对这些情况都需要进行处理；
  - 例如，乘法指令，如果还是提前1cycle进行唤醒：
数据捕捉结构的流水线
- 发射过程也需要分为仲裁(Select)和唤醒(Wake-up)两个流水段，只不过指令在被仲裁电路选中之后，不需要去读取物理寄存器了，而是直接读取payload RAM即可以得到操作数。
- 有的数据从payload ram中读取，有的数据从bypass 网络中获取；
- 图 8. 19 中将指令的选择和读取 payload RAM 放到了一个流水段，在这个阶段还负责将FU的计算结果“捕捉”到payload RAM中,很显然在这个周期做了很多事情；
  - 尤其是这个周期需要对payload RAM既进行读取、又进行写入,这个多端口的payload RAM会导致处理器的周期时间变得过大。
  - 同时,当FU的个数比较多时,FU结果的旁路网络也会占用不菲的硬件资源和过多的时间,因此可以进一步对流水线进行细分：将payload RAM放在下一个周期；

关注

6
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

newyork major CSDN认证博客专家 CSDN认证企业博客

码龄9年

146: 原创

3万+: 周排名

1万+: 总排名

11万+: 访问

: 等级

2772: 积分

968: 粉丝

1327: 获赞

3: 评论

1511: 收藏

私信

关注

热门文章

分类专栏

最新评论

CHI命令解析
可爱的呆弟: readnosnp不是non-allocated read类的嘛，cacheable而不会缓存进cache中吧
mmu之TLB的来源与实现
newyork major: 这里的打断流水线是指将整个流水线都flush，然后重新开始fetch, decode等操作，硬件是不需要这样做的，只是暂停流水线，处理完成后，继续使用之前放在instruction buffer中的指令，进行执行
mmu之TLB的来源与实现
大道至简道非恒道: 请教个问题：在“硬件方式”小节中的第三点说“这个过程中，还需要将整个流水线都暂停”，而最后一点又说“使用硬件处理TLB缺失的这种方法更适合超标量处理器，它不需要打断流水线”，这不是自相矛盾吗？
vimrc的一些操作
uku: up救我一命,每次打开都要切一下syntax on,节约我多少寿命,爱你

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。