现代微处理器-90分钟指南

最新推荐文章于 2021-11-13 10:52:16 发布

lilistudy

最新推荐文章于 2021-11-13 10:52:16 发布

阅读量3.9k

点赞数 2

文章标签： cache 编译器 x86 工作 behavior ibm

本文链接：https://blog.csdn.net/lilistudy/article/details/6386226

版权

本文深入浅出地介绍了现代微处理器的工作原理，涵盖了从时钟速度、流水线到多发射、超标量设计、VLIW架构、指令相关与延迟、分支预测、SIMD并行处理等多个关键概念。通过实例解析，展示了这些技术如何提高处理器性能，同时讨论了内存带宽和延迟的影响。适合有一定硬件基础的读者快速回顾和了解微处理器的最新发展。

摘要由CSDN通过智能技术生成

有了篇像样文章，虽然是翻译的。

翻译为学习之用，没有核对校正，觉得不准确有错误的地方请看原文

http://www.lighterra.com/papers/modernmicroprocessors/

现代微处理器

-90 分钟指南

By Jason Patterson , last updated Jan 2011 (orig Feb 2001)

一、不仅仅兆赫 ( 频率 ) 2

二、流水线和指令集并行 ... 2

三、深度流水线 - 超级流水线 ... 4

九、指令调度，寄存器重命名和 OoO .. 8

十、超智能的争论 ... 9

十一、 X86 是什么样的 ? . 10

十二、线程 -SMT, 超线程和多核 ... 11

十三、更多的核心或者更宽的核心 ... 13

十四、数据并行 -SIMD 矢量指令 ... 14

十五、 Caches 和内存架构 ... 15

十六、 Cache 冲突和相联度 ... 16

十七、内存带宽和延迟 ... 18

你是一个本科生，作为学位的一部分学习过硬件/ 汇编课程，但那时几年前的事情，现在你并没有跟踪处理器设计的最新细节。

你可能还没有意识到最近一些关键的主题正在快速发展。

流水线( 超标量,OoO,VLIW, 分支预测，预测)
多核、同时多线程(SMT, 超线程)
SIMD 矢量指令集(MMX/SSE/AVC,AltiVec)
缓存和内存架构

不用担心，这篇文章会让你快速跟上( 这些主题的发展) ，你将会像专家一样讨论顺序和乱序、超线程、多核和缓存优化.

准备好了，这篇文章很概括和切中要害没有空隙, 步伐非常的大.

一、不仅仅兆赫( 频率)

首先必须明确的是时钟速度和处理器性能之间的不同，他们不是一回事。请看一下几年之前一些处理器的测试结果：

		SPECint95	SPECfp95
195 MHz	MIPS R10000	11.0	17.0
400 MHz	Alpha 21164	12.3	17.2
300 MHz	UltraSPARC	12.1	15.5
300 MHz	Pentium-II	11.6	8.8
300 MHz	PowerPC G3	14.8	11.4
135 MHz	POWER2	6.2	17.6

虽然200 MHz MIPS R10000 300 MHz UltraSPARC 400 MHz Alpha 21164 时钟速度差了两倍，但是运行大多数程序的速度差不多相同，300 MHz Pentium-II 大多数程序速度和上面几个处理器差不多，但是浮点运算比如科学数字处理的速度大约只有的它们的一半, 对于同样300MhZ 的A PowerPC G3 在通常的整型运算代码比其他处理器稍快，但浮点运算比前三名慢了很多.

另一个极端情况，只有135MHz 的IBM POWER2 浮点运算速度和400MHz 的Alpha21164 差不多，但是通用整型程序速度只有它的一边

这些应该怎么解释呢？显然不仅仅是时钟速度再起作用，更重要的是处理器在每个时钟周期内做了多少工作，这就引出下面的课题.