计算机的性能指标
总体框架:
主
要
性
能
指
标
{
运
算
速
度
{
吞
吐
量
从
用
户
角
度
是
评
价
计
算
机
系
统
性
能
的
综
合
参
数
响
应
时
间
主
频
C
P
I
C
P
U
执
行
时
间
M
I
P
S
、
M
F
L
O
P
S
、
G
F
L
O
P
S
、
T
F
L
O
P
S
机
器
字
长
衡
量
计
算
机
并
行
处
理
能
力
数
据
通
路
带
宽
衡
量
计
算
机
在
功
能
型
部
件
之
间
的
数
据
传
输
能
力
主
存
容
量
衡
量
计
算
机
的
存
储
容
量
主要性能指标\begin{cases}\\运算速度\begin{cases}吞吐量 \ 从用户角度是评价计算机系统性能的综合参数\\响应时间\\主频\\CPI\\CPU 执行时间\\MIPS、MFLOPS、GFLOPS、TFLOPS\end{cases}\\机器字长 \ \ 衡量计算机并行处理能力\\数据通路带宽\ \ \ 衡量计算机在功能型部件之间的数据传输能力\\主存容量 \ \ \ 衡量计算机的存储容量\end{cases}
主要性能指标⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧运算速度⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧吞吐量 从用户角度是评价计算机系统性能的综合参数响应时间主频CPICPU执行时间MIPS、MFLOPS、GFLOPS、TFLOPS机器字长 衡量计算机并行处理能力数据通路带宽 衡量计算机在功能型部件之间的数据传输能力主存容量 衡量计算机的存储容量
1.字长:计算机进行一次整数运算所能处理的二进制数据的位数,字长越长,计算机运算精度越高
区分:
指令字长:一个指令包含二进制代码的位数
存储字长:一个存储单元存储二进制代码的长度,和 MDR 位数相等
机器字长:能一次性直接处理的二进制数据的位数,一般来说和 CPU 内部寄存器的位数是相等的,例如机器字长为 4 字节,那么它能够处理 4 * 8 位的二进制代码,1 字节 = 8bit,1bit = 1 位
数据字长:数据总线一次能并行传输信息的位数,与 MDR 位数无关
2.数据通路带宽:数据总线一次所能并行传送信息的位数
3.主存储容量:数据总线一次所能存储信息的最大容量
计算:总容量= 存储单元个数 * 存储字长
MAR 个数反映存储单元个数,MDR 位数 = 存储字长
例如:MAR = 32 位, MDR = 8 位
总容量=
2
32
∗
8
b
i
t
2^{32} * 8bit
232∗8bit = 4GB
4.吞吐量:系统在单位时间内处理请求的数量。
5.响应时间:指从用户向计算机发送一个请求,到系统对该请求做出响应并获得所需结果的等待时间
CPU 时钟周期:通常为节拍脉冲或 T 周期,是主频的倒数,是 CPU 中最小的时间单位,执行指令每个动作至少需要一个时钟周期。
主频:机器内部主时钟的频率,主频越高,完成指令的一个步骤所用的时间越短。
时
钟
周
期
=
1
主
频
时钟周期= \frac{1}{主频}
时钟周期=主频1
CPI:平均执行一条指令所需的时钟周期数,注意单位是个,不是秒
执
行
一
条
指
令
耗
时
=
C
P
I
∗
C
P
U
时
钟
周
期
执行一条指令耗时 = CPI * CPU 时钟周期
执行一条指令耗时=CPI∗CPU时钟周期
虽然时钟周期 =
1
时
钟
频
率
\frac{1}{时钟频率}
时钟频率1,但是 CPI 从概念上讲,与时钟频率无关。
时钟频率会改变计算机的运行速度但是不会改变 CPI
C P U 执 行 时 间 ( 整 个 程 序 耗 时 ) = C P U 时 钟 周 期 数 主 频 = 指 令 条 数 ∗ C P I 主 频 CPU 执行时间(整个程序耗时) = \frac{CPU 时钟周期数}{主频} = \frac{指令条数* CPI}{主频} CPU执行时间(整个程序耗时)=主频CPU时钟周期数=主频指令条数∗CPI
IPS:每秒执行多少指令
I
P
S
=
主
频
平
均
C
P
I
IPS = \frac{主频}{平均 CPI}
IPS=平均CPI主频
FLOPS:每秒执行多少次浮点数运算
跑分软件跑出来的性能评价存在缺陷,不能得到准确的性能评测结果。
一些常见问题:
主频高的 CPU 一定比主频低的快?
答:不是,CPI 不同,导致指令耗时不同。
AB 两个 CPU,平均 CPI 相同那么 A,一定更快吗
答:不是,看指令系统提供的功能。
透明的概念:
在计算机中,某个角度看不到的特性称改特性是透明的
在 CPU 中各个部件对于用户是否可见?
CPU
{
用
户
可
见
{
通
用
寄
存
器
组
程
序
状
态
字
寄
存
器
用
户
不
可
见
{
存
储
器
地
址
寄
存
器
存
储
器
数
据
寄
存
器
指
令
寄
存
器
\begin{cases}用户可见\begin{cases}通用寄存器组\\程序状态字寄存器\end{cases}\\用户不可见 \begin{cases}存储器地址寄存器\\存储器数据寄存器\\指令寄存器\end{cases}\end{cases}
⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎧用户可见{通用寄存器组程序状态字寄存器用户不可见⎩⎪⎨⎪⎧存储器地址寄存器存储器数据寄存器指令寄存器
周期的区分
时钟周期:CPU 中最小的时间单位
指令周期:CPU 从内存取出一条指令并执行这条指令 的时间总和
CPU 周期:又称机器周期,用从内存读取一条指令字的最短时间来定义
中断周期:执行一次中断所需要的周期
当前设计高性能计算机的重要技术
采用并行处理技术,计算机最珍贵的资源是 CPU,我们要尽可能让 CPU 在空闲时间忙起来。
关于提高主频和提高存储容量,它们的提高很有限且很废资源。
当代计算机体系结构分为两种
1.冯诺依曼体系结构
2.哈佛体系结构
两者的区别
一.存储器不同
1、冯诺依曼结构:冯诺依曼结构是一种将程序指令存储器和数据存储器合并在一起的存储器结构。
2、哈佛结构:哈佛结构使用两个独立的存储器模块,分别存储指令和数据,每个存储模块都不允许指令和数据并存。
二.总线不同
1、冯诺依曼结构:冯诺依曼结构没有总线,CPU与存储器直接关联。
2、哈佛结构:哈佛结构使用独立的两条总线,分别作为CPU与每个存储器之间的专用通信路径,而这两条总线之间毫无关联。
兼容
指计算机硬件或软件的通用性,即 使用或运行在某个型号的计算机系统中的硬件,软件也能应用于另外一个型号的计算机系统时,则称这两台计算机 在硬件或软件上存在兼容性
微型计算机的应用
应 用 { 科 学 计 算 ( 数 值 计 算 ) — 天 气 预 报 数 据 处 理 ( 信 息 管 理 ) — 加 工 管 理 与 操 作 任 何 形 式 的 数 据 资 料 辅 助 工 程 — 计 算 机 辅 助 工 程 ( C A D , C A M , C A T ) 生 产 自 动 化 — 对 工 业 生 产 过 程 中 某 些 信 号 进 行 自 动 检 测 , 处 理 应用\begin{cases}科学计算(数值计算)—天气预报\\数据处理(信息管理)—加工管理与操作任何形式的数据资料\\辅助工程— 计算机辅助工程(CAD,CAM,CAT)\\生产自动化—对工业生产过程中某些信号进行自动检测,处理\end{cases} 应用⎩⎪⎪⎪⎨⎪⎪⎪⎧科学计算(数值计算)—天气预报数据处理(信息管理)—加工管理与操作任何形式的数据资料辅助工程—计算机辅助工程(CAD,CAM,CAT)生产自动化—对工业生产过程中某些信号进行自动检测,处理
缩短程序执行时间的措施
- 选择更好的算法更快的解决问题
- 实现高级语言所描述的过程可以采用多种底层指令序列
- 提高 CPU 的时钟频率
- 优化数据通路结构
- 对程序编译进行优化
CPU 速度指标
MIPS :每秒执行多少百万条指令,衡量标准机
MFLOPS、GFLOPS、TFLOPS :浮点数运算速度,衡量向量机
CPI、IPC:单条指令执行速度
主频(时钟周期):整体运行速度
吞吐量:批量处理性能
响应时间:交互性能