CPU流水线技术全面解读

最新推荐文章于 2024-08-24 11:35:17 发布

头发够用的程序员

最新推荐文章于 2024-08-24 11:35:17 发布

阅读量6.2k

点赞数 32

文章标签：系统架构

本文链接：https://blog.csdn.net/weixin_43719763/article/details/135769082

版权

本文详细介绍了CPU流水线的工作原理，超流水线技术的应用，以及流水线冒险（包括结构冒险、数据冒险和控制冒险）的解决方法。此外，还探讨了分支预测、乱序执行、SIMD和NEON在提升性能中的作用，以及单发射和多发射处理器的区别和优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0. 引言

流水线是工业社会化大生产背景下的产物，可以极大地提高生产效率。

流水线上的每个工人只需要专注自己所涉及的环节，便可以使整个流水线高效运行。

举个例子，假如生产一步手机需要三个步骤，组装，质检和贴膜包装，如果每个人独立负责各个环节。
在这里插入图片描述
这样看似没什么问题，实际上需要很大的学习成本，每个人因为要学习整个手机的生产技能，分身乏术，且一旦产品出了问题，也不方便找到具体的人。

如果是每个人只负责一个环节，就会好很多。
在这里插入图片描述
A只负责组装，同理，B负责质检，C负责贴膜和包装，每个人责任明确，工作起来也很高效。CPU流水线与其原理类似。

本篇内容提要：
在这里插入图片描述

1.流水线工作原理

一条指令的执行需要经过取指令，翻译指令，执行指令三个基本流程。CPU内部的电路也分为不同的单元：取指单元、译码单元、执行单元等，指令的执行也是按照流水线的工序一步一步执行的。

若不采用流水线技术，则每个时钟周期内只有一个单元在工作，其余两个单元在“观望”，如下图所示：
（假设每个单元的工作周期都为1，且不算流程转换的时间）
在这里插入图片描述
引入流水线技术之后，就大不一样了，每个电路单元都状态拉满，基本不会有空闲：

从上图中可以看到，从第三个时钟周期开始，每个单元都会“满状态”工作，CPU的指令执行效率大幅提升。

流水线的本质就是拿空间换时间。将每条指令的步骤分解到不同的电路单元，从而使得多个指令并行执行。

2.超流水线技术

上述流水线确实可以提升CPU的工作效率，但我们假设了每个小环节的执行周期是相同的，但若不同呢？现在我们假设取指单元的工作需要两个时钟周期来完成，就会出现以下情况：
在这里插入图片描述
可以发现，又会出现部分工作单元出现空闲的情况，为了进一步提升效率，我们可以这样做：
将取指的工作分配给两个物理单元去完成，这时又会像开始那样，非常高效地运行，如下图所示：

这样设计，我们便通过增加流水线的深度提升了CPU处理指令的效率。