00.《计算机体系结构》课程作业1题单

《计算机体系结构》课程作业1题单

1.什么是层次结构、系统结构、计算机组成、计算机实现、Amdahl定律、程序的局部性原理、异构型多处理、同构型多处理机?

2.Flynn冯氏分类是根据什么对计算机进行分类的?可分成哪4类?

3.分别从执行程序的角度和处理数据的角度来看,计算机系统中并行性等级从低到高可分为哪几级?

4.举例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。

5.某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如 下表所示。求该计算机的有效CPI、速率和程序执行时间。

6.将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

7.某计算机系统中有3个部件可以改进,这3个部件的部件加速比如下:部件1加速比=30 部件2加速比=20 部件3加速比=10

8.假设某应用程序中有3类操作,通过改进,各操作获得不同的性能提高。具体数据如下表:

9.假设浮点数指令(FP指令)的比例为30%,其中浮点数平方根(FPSQR)占全部指令的比例为4%,FP操作的CPI为5,FPSQR操作的CPI为20,其他指令的平均CPI为1.25。现有两种改进方案,第一种是把FPSQR操作的CPI减至3,第二种是把所有的FP操作的CPI减至3,试比较两种方案对系统性能的提高程度。

1.什么是层次结构、系统结构、计算机组成、计算机实现、Amdahl定律、程序的局部性原理、异构型多处理、同构型多处理机?

答:多级层次结构一一按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级云次结构,每一层以一种不同的语言为特征。这些层次依次为: 微程序机器级,机器语言(传统机器级),操作系统虚拟机,汇编语言虚拟机,高级语言虚拟机,应用语言虚拟机等。
计算机系统结构一一指机器语言程序员所看到的计算机属性,即概念性结构与功能特性。
计算机组成一一指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及辑设计等。
计算机实现一一指的是计算机组成的物理实现,包括处理机主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
Amdahl 定律一一当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理一一程序执行时所访问的存储器地址不是随机分布的,而是相对地簇案。
异构型多处理机系统一一由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠原理,依次对多个任务进行加工,各自完成规定的功能动作。
同构型多处理机系统一一由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。

2.Flynn冯氏分类是根据什么对计算机进行分类的?可分成哪4类?

答:Flynn分类法是按照指令流和数据流的多倍性进行分类的,它把计算机系统结构分为单指令流单数据流(SISD)、单指令流多数据流(SIMD)、多指令流单数据流(MISD)、多指令流多数据流(MIMD)。

3.分别从执行程序的角度和处理数据的角度来看,计算机系统中并行性等级从低到高可分为哪几级?

答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构的范畴;确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成的范畴,而选择存储芯片类型、微组装技术、线路设计等属于计算机实现的范畴。
计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种系统结构可以有多种组成。一种组成可以有多种实现。

4.举例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。

答:从处理数据的角度来看,并行性等级从低到高可分为:
(1)字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存在并行性;
(2)字串位并:同时对一个字的全部位进行处理,不同字之间是串行的。已开始出现并行性;
(3)字并位串:同时对许多字的同一位(称为位片) 进行处理。这种方式具有较高的并行性;
(4)全并行:同时对许多字的全部位或部分位进行处理。这是最高一级的并行。
从执行程序的角度来看,并行性等级从低到高可分为:
(1)指令内部并行:单条指令中各微操作之间的并行:(2) 指令级并行:并行执行两条或两条以上的指令;
(3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位;
(4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程段),以子程或进程为调度单元;
(5)作业或程序级并行:并行执行两个或两个以上的作业或程序。

5.某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如 下表所示。求该计算机的有效CPI、速率和程序执行时间。

指令类型指令执行数量平均时钟周期数
整数400001
数据传送650002
浮点70004
分支10002
答:

(1)CPI =(45000X1+75000X2+8000X4+1500X2)/129500=1.776

(2) MIPS 速率=f/ CPI =400/1.776 =225.225MIPS

(3)程序执行时间=(45000X1+75000X2+8000X4+1500X2)/400=575us

6.将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

解:由题意可知,可改进比例=40%=0.4,部件加速比=10。根据Amdahl定律可知:

系统加速比=1/((1-0.4)+0.4/10)=1.5625

采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

7.某计算机系统中有3个部件可以改进,这3个部件的部件加速比如下:

部件1加速比=30 部件2加速比=20 部件3加速比=10

(1)如果部件1和部件2的可改进比例分别为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?

(2)如果3个部件的可改进比例分别为30%、30%、20%,3个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?

解:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eS4I6kjG-1682399060454)(D:\个人文件\黑群晖相关\个人黑群晖刷机过程 DS918+xs_42962\docker相关\MD图片资源\3题image-20230425125714335.png)]

8.假设某应用程序中有3类操作,通过改进,各操作获得不同的性能提高。具体数据如下表:

操作类型程序中的数量(百万条指令)改进前的执行时间(周期)改进后的执行时间(周期)
操作11021
操作2302015
操作335103
操作41541

(1) 改进后,各类操作的加速比分别是多少?
(2) 各类操作单独改进后,程序获得的加速比分别是多少?

(3) 3类操作同时改进后,整个程序的加速比是多少?

解:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Prnvd94P-1682399060455)(C:\Users\WmingxiangWen\AppData\Roaming\Typora\typora-user-images\image-20230425125815732.png)]

9.假设浮点数指令(FP指令)的比例为30%,其中浮点数平方根(FPSQR)占全部指令的比例为4%,FP操作的CPI为5,FPSQR操作的CPI为20,其他指令的平均CPI为1.25。现有两种改进方案,第一种是把FPSQR操作的CPI减至3,第二种是把所有的FP操作的CPI减至3,试比较两种方案对系统性能的提高程度。

解:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DOQKBNz-1682399060456)(C:\Users\WmingxiangWen\AppData\Roaming\Typora\typora-user-images\image-20230425125833069.png)]

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

无奈清风吹过

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值