第1章计算机系统概述__计算机系统性能评价之2_用执行速度进行性能评估

最早用来衡量计算机性能的速度指标是每秒钟完成单个运算(如加法) 指令的条数。

指令速度所用的计量单位为MIPS (Million Instructions Per Second) ,其含义是平增多每秒钟执行多少百万条指令

即MIPS:  平均每秒钟执行多少百万条指令

一  还有一个概念:指令平均执行时间,也称等效指令速度法或Gibson混合法。根据该法,通过统计各类指令在程序中所占比例进行折算。

设某类指令 i 在程序中所占比例为Wi,  执行时间为 ti, 则等效指令的执行时间为 T = w1 * t1 + w2 * t2 + ...+ wn * tn(n 为指令种类数). 若指令执行时间用时钟周期数来衡量的话, 则上式计算的结果就是 CPI。 对指令平均执行时间求倒数能够得到 MIPS 值。

二 选取一组指令组合, 使得得到的平均CPI最小, 由此得到的MIPS就是峰值MIPS (Peak MIPS)

三  MIPS反映了机器执行定点指令的速度, 但是用MIPS来对不同的机器进行性能比较有时是不准确或不客观的。

看一个例子:假定某程序 P 编译后生成的目标代码由A、B、C、D四类指令组成,它们在程序中所占的比例分别为43%, 21%, 12%, 24%, 已知它们的CPI分别为1 、2、2、2。 现重新对程序P进行编译优化,生成的新目标代码中 A 类指令条数减少了50%, 其他类指令的条数没有变。 请回答下列问题。

(1) 编译优化前后程序的 CPI 各是多少?

(2) 假定程序在一台主频为 50 MHz 的计算机上运行,则优化前后的  MIPS各是多少?

解: 优化后 A类指令的条数减少了50%, 因而各类指令所占比例分别计算如下。

A类指令: 21.5/(21.5 + 21 + 12+ 24)= 27%

B类指令:  21 / (21.5+ 21 + 12 +24) = 27%

C类指令:12/(21.5+21+12+24)=15%

D类指令: 24/ (21.5+21+12+24) = 31%

(1) 优化前后程序的CPI分别计算如下。

优化前: 43% *1 + 21%*2 + 12%*2 + 24%*2 = 1.57

优化后:27%*1 + 27% * 2 + 15% *2 + 31%*2 = 1.73

(2)优化前后程序的 MIPS 分别计算如下,   依据公式: 时钟频率 /  CPI = MIPS

优化前 50 M / 1.57 = 31.8 MIPS

优化后: 50M / 1.73 = 28.9 MIPS

从MIPS来看,优化后程序执行速度反而变慢了。 从这个例子可以看出,用MIPS数进行性能估计是不可靠的。

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本科生期末试卷六 一. 选择题(每小题1分,共10分) 1. 完整的计算机应包括___d___。 A 运算器、存储器、控制器 ; B 外部设备和主机 ; C 主机和实用程序 ; D 配套的硬件设备和软件系统 ; 2. 用64位字长(其中1位符号位)表示定点小数时,所能表示的数值范围是___b___。 A [ 0,264 – 1 ] B [ 0,263 – 1 ] C [ 0,262 – 1 ] D [ 0,263 ] 3. 四片74181ALU和1片74812CLA器件相配合,具有如下进位传递功能___b___。 A 行波进位 ; B 组内先行进位,组间先行进位 ; C 组内先行进位,组间行波进位 ; D 组内行波进位,组间先行进位 ; 4. 某机字长32位,存储容量为 1MB,若按字编址,它的寻址范围是___c___。 A 0—1M B 0—512KB C 0—256K D 0—256KB 5. 某一RAM芯片,其容量为512×8位,除电源和接地端外,该芯片引出线的最小数目应是___d___。 A 23 B 25 C 50 D 19 6.堆栈寻址方式中,设A为通用寄存器,SP为堆栈指示器,MSP为SP指示器的栈顶单元,如果操作的动作是:(A)→MSP ,(SP)- 1 →SP ,那么出栈的动作应是___b___。 A (MSP)→A, (SP) + 1→SP ; B (SP) + 1→SP ,(MSP)→A ; C (SP) - 1→SP ,(MSP)→A ; D (MSP)→A ,(SP) - 1→SP ; 7.指令周期是指___c___。 A CPU从主存取出一条指令的时间 ; B CPU执行一条指令的时间 ; C CPU从主存取出一条指令加上CPU执行这条指令的时间 ; D 时钟周期时间 ; 8.在___a___的微型计算机系统中,外设可和主存贮器单元统一编址 ,因此可以不使用I / O指令。 A 单总线 B 双总线 C 三总线 D 多总线 9.在微型机系统中,外围设备通过___a___与主板的系统总线相连接。 A 适配器 B 设备控制器 C 计数器 D 寄存器 10.CD—ROM光盘的标准播放时间为60分钟。在计算模式1情况下,光盘的存储容量为 ___b___。 A 601MB B 527MB C 630MB D 530MB 二. 填空题(每小题3分,共24分) 1.计算机的硬件包括A.___存储器___,B.___运算器___,C.___控制器___适配器,输入输出部分。 2.按IEEE764标准,一个浮点数由A.___符号位___,阶码E ,尾数m 三部分组成。其中阶码E 的值等于指数的B.___基值___加上一个固定C.___偏移量___。 3.存储器的技术指标有A.___存储容量___,B.___存储时间___,C.__存储周期____,存储器带宽。 4.指令操作码字段表征指令的A.___操作___,而地址码字段指示B.__特征与功能___。微小型机多采用 C.___操作数的地址___混合方式的指令格式。 5. CPU中至少有如下六类寄存器,除了A.___指令___寄存器,B.____程序__计数器,C.___地址___寄存器外,还应有通用寄存器,状态条件寄存器,数据缓冲寄存器。 6.总线有A.___物理___特性,B.___功能___特性,电气特性,C.___机械___特性。 7.不同的CRT显示标准所支持的最大A.__分辨率___和B.___颜色___数目是C.___不同___的。 8.中断处理需要有中断A.___优先级仲裁___,中断B.___向量___产生,中断C.___控制逻辑___等硬件支持。 三.应用题 1. (11分)设有两个浮点数 N1 = 2j1 × S1 , N2 = 2j2 × S2 ,其中阶码2位,阶符1位,尾数四位,数符一位。设 :j1 = (-10 )2 ,S1 = ( +0.1001)2 j2 = (+10 )2 ,S2 = ( +0.1011)2 求:N1 ×N2 ,写出运算步骤及结果,积的尾数占4位,要规格化结果,用原码阵列乘法器求尾数之积。 2. (11分)已知某8位机的主存采用半导体存贮器,地址码为18位,若使用4K×4位RAM芯片组成该机所允许的最大主存空间,并选用模块条的形式,问: (1) 若每个摸条为32K×8位,共需几个模块条? (2) 每个模块内共有多少片RAM芯片? (3) 主存共需多少RAM芯片?CPU如何选择各模块条? 3. (11分)图B6.1是某SRAM的写入时序,其中R / W 是读 、写命令控制线,当R / W 线为低电平时,存贮器按给定地址把数据线上的数据写入存贮器。请指出图中时序的错误,并画出正确的写入时序。 图B6.1 4. (11分)某计算机有如下部件:ALU,移位器,主存M,主存数据寄存器MDR,主存地址寄存器MAR,指令寄存器IR,通用寄存器R0——R3 ,暂存器C和D。 (1) 请将各逻辑部件组成一个数据通路,并标明数据流向。 (2) 画出“ADD R1,(R2)+ ”指令的指令周期流程图,指令功能是 (R1)+((R2))→R1。 ALU 图B6.2 5. (11分)集中式仲裁有几种方式?画出计数器定时查询方式的逻辑结构图,说明其工作原理。 6. (11分)刷存的主要性能指标是它的带宽。实际工作时显示适配器的几个功能部分要争用刷存的带宽。假定总带宽的50%用于刷新屏幕,保留50%带宽用于其他非刷新功能。 (1) 若显示工作方式采用分辨率为1024×768,颜色深度为3B,帧频(刷新速率)为72HZ,计算总带宽。 (2) 为达到这样高的刷存带宽,应采取何种技术措施?

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值