计算机组成原理之计算机的性能指标

最新推荐文章于 2024-06-26 10:40:52 发布

心碎烤肠

最新推荐文章于 2024-06-26 10:40:52 发布

阅读量2.8k

点赞数 12

分类专栏：计算机组成原理文章标签：计算机组成原理计算机性能指标

本文链接：https://blog.csdn.net/qq_64017312/article/details/139569900

版权

计算机组成原理专栏收录该内容

11 篇文章 2 订阅

订阅专栏

1.4.2时钟脉冲信号和时钟周期的相关概念

计算机的性能指标

复习提示

本章是组成原理的概述，考查时易针对有关概念或性能指标出选择题，也可能综合后续章节的内容出有关性能分析的综合题。

掌握本章的基本概念，是学好后续章节的基础。

部分知识点在初学时理解不深刻也无须担忧，相信随着后续章节的学习，一定会有更为深入的理解。

学习本章时，请读者思考以下问题：

1) 计算机由哪几部分组成? 以哪部分为中心?
2) 主频高的 CPU 一定比主频低的 CPU 快吗? 为什么?
3) 翻译程序、汇编程序、编译程序、解释程序有什么差别? 各自的特性是什么?
4) 不同级别的语言编写的程序有什么区别? 哪种语言编写的程序能被硬件直接执行?

请读者在学习本章的过程中寻找答案，本章末尾会给出参考案。

1.计算机的主要性能指标

1.1机器字长

1.1.1与机器字长位数相同的部件

【命题追踪——与机器字长位数相同的部件(2020、2021)】

通常所说的“某 16 位或 32 位机器”，其中的 16、32 指的是机器字长，简称字长。

字长是指计算机进行一次整数运算(即定点整数运算)所能处理的二进制数据的位数，通常与 CPU 的寄存器位数、ALU 有关。

因此，字长一般等于通用寄存器的位数或 ALU 的宽度，字长越长，数的表示范围越大，计算精度越高。

计算机字长通常选定为字节(8位)的整数倍。

注意：机器字长、指令字长和存储字长的关系(见章末的常见问题3)

1.2数据通路带宽

数据通路带宽是指数据总线一次所能并行传送信息的位数。

这里所说的数据通路宽度是指外部数据总线的宽度，它与 CPU 内部的数据总线宽度(内部寄存器的大小)有可能不同。

注意：各个子系统通过数据总线连接形成的数据传送路径称为数据通路

1.3主存容量

主存容量是指主存储器所能存储信息的最大容量,通常以字节来衡量,也可用字数x字长(如512Kx16 位)来表示存储容量。

其中，MAR 的位数反映了存储单元的个数，MDR 的位数反映了存储单元的字长。

例如，MAR 为16 位，表示 2¹⁶=65536，即此存储体内有 65536 个存储单元(可称为 64K 内存，1K=1024)，

若 MDR 为32 位，则表示存储容量为64Kx32 位。

1.4运算速度

1.4.1提高系统性能的综合措施

【命题追踪——提高系统性能的综合措施(2010)】

(1) 吞吐量和响应时间。

吞吐量。指系统在单位时间内处理请求的数量。

它取决于信息能多快地输入内存，CPU 能多快地取指令，数据能多快地从内存取出或存入，以及所得结果能多快地从内存送给一台外部设备。

几乎每步都关系到主存储器，因此系统吞吐量主要取决于主存储器的存取周期。

响应时间。指从用户向计算机发送一个请求，到系统对该请求做出响应并获得所需结果的等待时间。

通常包括 CPU 时间(运行一个程序所花费的时间)与等待时间(用于磁盘访问、存储器访问、I/O 操作、操作系统开销等的时间)。

(2) 主频和 CPU 时钟周期。

1.4.2时钟脉冲信号和时钟周期的相关概念

【命题追踪——时钟脉冲信号和时钟周期的相关概念(2019)】

CPU 时钟周期。机器内部主时钟脉冲信号的宽度，它是 CPU 工作的最小时间单位。

时钟脉冲信号由机器脉冲源发出的脉冲信号经整形和分频后形成。

时钟周期以相邻状态单元间组合逻辑电路的最大延迟为基准确定。

时钟周期也以指令流水线的每个流水段的最大延迟时间确定。

1.4.3主频和时钟周期的转换计算

【命题追踪——主频和时钟周期的转换计算(2013)】

主频(CPU 时钟频率)。机器内部主时钟的频率，即时钟周期的倒数，它是衡量机器速度的重要参数。

对于同一个型号的计算机，其主频越高，完成指令的一个执行步骤所用的时间越短，执行指令的速度越快。

主频最直观的理解就是每秒有多少个时钟周期。

注意：CPU 时钟周期 =1/主频，主频通常以 Hz(赫兹)为单位，10Hz表示每秒 10 次。

(3) CPI(Cycle Per Instruction)。

即执行一条指令所需的时钟周期数。

1.4.4IPS的相关计算

【命题追踪——IPS的相关计算(2023)】

不同指令的时钟周期数可能不同，因此对于一个程序或一台机器来说，

其 CPI 指该程序或该机器指令集中的所有指令执行所需的平均时钟周期数，此时CPI是一个平均值。

IPS(Instructions Per Second)，即每秒执行多少条指令，IPS= 主频/平均 CPI。

(4) CPU 执行时间。

指运行一个程序所花费的时间。

1.4.5CPU执行时间的相关计算

【命题追踪——CPU执行时间的相关计算(2012、2013、2014、2017、2022、2023)】

CPU 执行时间 =CPU 时钟周期数/主频=(指令条数×CPI)÷主频

上式表明，CPU 的性能(CPU执行时间)取决于三个要素：主频、CPI 和指令条数。

主频、CPI 和指令条数是相互制约的。

例如，更改指令集可以减少程序所含的指令条数，但同时可能引起 CPU 结构的调整，从而可能会增加时钟周期的宽度(降低主频)。

【例 1.1】

假定计算机 M1和 M2具有相同的指令集体系结构，M1的主频为 2GHz，程序P在M1 上的运行时间为 10s。

M2 采用新技术可使主频大幅提升，但平均 CPI 也增加到 M1 的 15 倍。
则 M2 的主频至少提升到多少才能使程序P在 M2 上的运行时间缩短为 6s?

解：

程序P在M1上的时钟周期数 = 指令条数×CPI = CPU执行时间×主频=10s×2GHz=2x10¹⁰ 。
M2 的平均 CPI为 M1 的 1.5 倍，因此程序 P 在 M2 上的时钟周期数 =1.5×2×10¹⁰=3x10¹⁰ 。
要使程序 P在 M2 上的运行时间缩短到 6s，则 M2 的主频至少应为
程序P所含时钟周期数 ÷ CPU 执行时间 =3x10¹⁰ ÷ 6s = 5GHz

由此可见，M2 的主频是 M1的 2.5 倍，但 M2 的速度却只是 M1 的 1.67 倍。

(5)MIPS(Million Instructions Per Second)。

即每秒执行多少百万条指令。

1.4.6MIPS 相关的计算

【命题追踪——MIPS 相关的计算(2012、2013)】

MIPS = 指令条数 ÷ (执行时间×10⁶)= 主频 ÷ (CPIx10⁶)。

MIPS 对不同机器进行性能比较是有缺陷的，因为不同机器的指令集不同，指令的功能也就不同。

比如在机器 M1 上某条指令的功能也许在机器 M2 上要用多条指令来完成；

不同机器的 CPI和时钟周期也不同，因而同一条指令在不同机器上所用的时间也不同。

(6) FLOPS(Floating-point Operations Per Second)。

即每秒执行多少次浮点运算

1.4.7浮点数运算指标的概念

【命题追踪——浮点数运算指标的概念(2011、2021)】

MFLOPS (Million FLOPS)，即每秒执行多少百万(10⁶)次浮点运算。
GFLOPS (Giga FLOPS)，即每秒执行多少十亿(10⁹)次浮点运算。
TFLOPS (Tera FLOPS)，即每秒执行多少万亿(10¹²)次浮点运算。
PFLOPS (Peta FLOPS)，即每秒执行多少千万亿(10¹⁵)次浮点运算。
EFLOPS (Exa FLOPS)，即每秒执行多少百京(10¹⁸)次浮点运算(1京 =1亿亿 =10¹⁶)。
ZFLOPS (Zetta FLOPS)，即每秒执行多少十万京(10²¹)次浮点运算。

注意：

在描述存储容量、文件大小等时，K、M、G、T通常用2的幂次表示，如 1Kb=2¹⁰b；
在描述速率、频率等时，k、M、G、T通常用 10 的幂次表示，如 1kb/s=10³b/s。
通常前者用大写的K，后者用小写的k，但其他前缀均为大写，表示的含义取决于所用的场景

1.5基准程序

基准程序 (Benchmarks) 是专门用来进行性能评价的一组程序，能够很好地反映机器在运行实际负载时的性能，

可以通过在不同机器上运行相同的基准程序来比较在不同机器上的运行时间，从而评测其性能。

对于不同的应用场合，应该选择不同的基准程序。

使用基准程序进行计算机性能评测也存在一些缺陷，因为基准程序的性能可能与某一小段的短代码密切相关，而硬件系统设计人员或编译器开发者可能会针对这些代码片段进行特殊的优化，使得执行这段代码的速度非常快，以至于得不到准确的性能评测结果。

2.几个专业术语

1) 系列机。具有基本相同的体系结构，使用相同基本指令系统的多个不同型号的计算机组成的一个产品系列。

2) 兼容。指软件或硬件的通用性，即运行在某个型号的计算机系统中的硬/软件也能应用于另一个型号的计算机系统时，称这两台计算机在硬件或软件上存在兼容性。

3) 固件。将程序固化在ROM 中组成的部件称为固件。

固件是一种具有软件特性的硬件，吸收了软件/硬件各自的优点，其执行速度快于软件，灵活性优于硬件，是软/硬件结合的产物。

例如，目前操作系统已实现了部分固化(把软件永恒地存储于ROM 中)。

知识回顾

3.本章小结

本章开头提出的问题的参考答案如下。

1) 计算机由哪几部分组成?以哪部分为中心?

计算机由运算器、控制器、存储器、输入设备及输出设备五大部分构成，现代计算机通常把运算器和控制器集成在一个芯片上，合称中央处理器。
在微处理器面世之前，运算器和控制器分离，而且存储器的容量很小，因此设计成以运算器为中心的结构，其他部件都通过运算器完成信息的传递。
随着微电子技术的发展，同时计算机需要处理、加工的信息量也与日俱增，大量 I/O 设备的速度和 CPU 的速度差距悬殊，因此以运算器为中心的结构不能满足计算机发展的要求。
现代计算机已发展为以存储器为中心，使 I/O 操作尽可能地绕过 CPU，直接在 I/O 设备和存储器之间完成，以提高系统的整体运行效率。

2) 主频高的 CPU 一定比主频低的 CPU 快吗?为什么?

衡量 CPU 运算速度的指标有很多，不能以单独的某个指标来判断 CPU的好坏。
CPU 的主频表示 CPU 内数字脉冲信号振荡的速度，主频和实际的运算速度存在一定的关系，但目前还没有一个确定的公式能够定量两者的数值关系，因为 CPU 的运算速度还要看 CPU 的流水线的各方面的性能指标(架构、缓存、指令集、CPU 的位数、Cache 大小等)。
由于主频并不直接代表运算速度，因此在一定情况下很可能会出现主频较高的 CPU 实际运算速度较低的现象。

3) 翻译程序、汇编程序、编译程序、解释程序有什么差别?各自的特性是什么?