cpi 计算机体系结构 转移指令,计算机体系结构题目.ppt

《计算机体系结构题目.ppt》由会员分享,可在线阅读,更多相关《计算机体系结构题目.ppt(26页珍藏版)》请在人人文库网上搜索。

1、计算机系统结构(2010年春)-基本概念:CPI/阿姆达尔定律,山东大学计算机学院 戴鸿君 ,计算机设计专题,CPI 阿姆达尔定律,2020/7/14,2,CPU的性能 将程序执行的时间进行分解 (1) 计算机工作的时钟频率 计算机系统中与实现技术和工艺有关的因素。 单位是MHz(f)。 (2) 总时钟周期数,程序执行的cpu时间 :,CPU时间 = 总时钟周期数 / 时钟频率,“指令时钟数”CPI(Cycles Per Instruction) 一个与计算机体系结构有关的参数。,CPI = 总时钟周期数 / IC,程序执行的CPU时间可以写成 总CPU时间 = CPI IC / 时钟频率, 。

2、时钟频率:反映了计算机实现技术、生产工艺 和计算机组织。,IC:程序执行过程中所处理的指令数。, CPI:反映了计算机实现技术、计算机指令集 的结构和计算机组织。 IC:反映了计算机指令集的结构和编译技术。,假设:计算机系统有n种指令; CPIi :第i种指令的时钟周期数; Ii :在程序中第i种指令出现的次数; 则程序执行时间为 CPU时间 = (CPIi Ii) / 时钟频率 即得: CPI = (CPIi Ii) / IC = (CPIi Ii / IC) 其中:(Ii / IC)反映了第i种指令在程序中所占的 比例。,i=1,i=1,i=1,n,n,n,对CPU性能公式进行进一步细化,。

3、定量指标,反映程序的运行速度 MIPS(Million Instructions Per Second,每秒百万条指令数) MFLOPS(Million Floating Point Operations Per Second,每秒百万次浮点运算),计算机设计专题,CPI 阿姆达尔定律,2020/7/14,7,计算机系统定量设计原理,三条基本原则和方法:,(1)哈夫曼(Huffman)压缩定理 对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。 这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能明显提高整个系统的性能。 (2)Amda。

4、hl定律 加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。,1) 加速比,系统加速比依赖于两个因素: 可改进比例fnew:可改进部分在原系统计算时间中所占的 比例,它总是小于等于的。 例如: 一个需运行60秒的程序中有20秒的运算可以 加速,那么该比例就是20/60。,系统加速比Sp = =,部件加速比rnew:可改进部分改进以后的性能提高, 一般情况下它是大于的 。 例如: 系统改进后执行程序,其中可改进部分花 费2秒的时间,而改进前该部分需花费5秒, 则性能提高为5/2。 总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间,总执行时间改。

5、进后=(1-可改进比例fnew)总执行时间改进前 + = (1-可改进比例fnew) + 总执行时间改进前,系统加速比为改进前与改进后总执行时间之比: 系统加速比Sp = =,2) Amdahl定律:性能递减规则 如果仅仅对计算机中的一部分做性能改 进,则改进越多,系统获得的效果越小。 推论:如果只针对整个任务的一部分进行优化, 那么所获得的加速比不大于1/(1-fnew)。 3) 一个“好”的计算机系统:具有高性价比的计 算机系统是一个带宽平衡的系统,而不是看它 使用的某些部件的性能 。,(3)程序的局部性原理 程序在执行时所访问地址的分布不是随机 的,而是相对地簇聚;这种簇聚包括指令和数 。

6、据两部分。 程序的时间局部性:程序即将用到的信息很 可能就是目前正在使用的信息。 程序的空间局部性:程序即将用到的信息很 可能与目前正在使用的信息在空间上相邻或者 临近。 存储器体系的构成就是以访问的局部性原理为基础的。,CPU时间,CPI = 总时钟周期数 /指令数 总CPU时间 = CPI 指令数/ 时钟频率 总CPU时间 = (CPIi Ii) / 时钟频率 Ii :在程序中第i种指令出现的次数 CPI = (CPIi Ii) /指令数,2020/7/14,15,Amdahl定律,2020/7/14,16,2020/7/14,17,假设我们考虑条件分支指令的两种不同设计方法如下:(1) 。

7、CPU1:通过比较指令设置条件码,然后测试条件码进行分支;(2)CPU2:在分支指令中包括比较过程。 在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。 由于CPU1在分支时不需要比较,因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU更快? 如果CPU1的时钟周期时间仅仅比CPU2快1.1倍,哪一个CPU更快呢?,2020/7/14,18,用一台40MHZ处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:,求有效CPI、MIPS速率。

8、和程序的执行时间,2020/7/14,19,如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33; FPSQR操作的比例为2%, FPSQR的CPI为20。 FPSQL操作属于FP操作的一部分。 假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。 试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。,2020/7/14,20,假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%, 采用加快措施后能使整个系统的性能提高多少?,2020/7/14,21,2。

9、005年11月考试题目 在计算机系统中,某一功能的处理时间为整个系统运行时间的50%,若使该功能的处理速度加快10倍,根据Amdahl定律,这样做可以使整个系统的性能提高__(43)__倍。若要使整个系统的性能提高1.5倍,则该功能的处理速度应加快__(44)__倍。 (43)A. 1.6 B. 1.7 C. 1.8 D. 1.9 (44)A. 3 B. 5 C. 7 D. 8,2020/7/14,22,如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用标量方式求解部分所花费时间占总的时间的百分比为可向量化百分比请画出加速比与可向量化比例两者之间关系的曲线 为获得采用向量方式最大。

10、加速比的半值(即10)时,所需可向量化的百分比为多少? 某程序可向量化部分70%。向量处理速度加倍(即40)和向量工作方式的百分比增大多少使性能得到同样提高?,2020/7/14,23,某台计算机只有Load/Store 指令能对存储器进行读/写操作,其它指令只对寄存器进行操作。根据程序跟踪实验结果,已知每种指令所占的比例及CPI数如下: 指令类型 指令所占比例 CPI 算逻指令 43 1 Load指令 21 2 Store指令 12 2 转移指令 24 2 (1) 求上述情况下的平均CPI。 (2) 假设程序有M条指令组成。算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在。

11、算逻指令执行前用Load指令从存储器取到寄存器。因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器存储器类型,假设这种指令的CPI等于2。同时,转移指令的CPI变为3。求新指令系统的平均CPI。,2020/7/14,24,假设在一台40MHZ处理机上运行200,000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下: 指令类型 CPI 指令混合比 算术和逻辑 1 60% 高速缓存命中的加载/存储 2 18% 转移 4 12% 高速存储缺失的存储器访问 8 10% (a) 计算在单处理机上用上述跟。

12、踪数据运行程序的平均CPI。 根据(a)所得的CPI,计算相应的MIPS速率。 求20000条代码的运行时间。,2020/7/14,25,采用哪种实现技术来求浮点数平方根的操作对系统的性能影响较大。 一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍,假设FPSQR操作占整个测试程序执行时间的20%。 另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。 请比较这两种设计方案。,开放式问答题,搜索目前最新的一款PC上使用的CPU的性能参数,以体系结构的视角进行描述 从摩尔定律、阿姆达定律出发,讨论此款CPU相对于以往CPU性能提升的原因。,2020/7/14,26。

一、单项选择题(本大题共 10 小题,每小题 1 分,共 10 分) 单项选择题 本大题共 小题, 1.计算机系列化的优点不包括( ) . A.有利于计算机的升级换代 B.便于组成多机系统和网络 C.同一系列内的软件一定是向下兼容的 D.在使用共同系统软件的基础上解决程序的兼容性 2.计算机的结构与组成不包括( . ) A.操作系统 B.硬联逻辑 C.微程序控制 D.所有硬件和固件的功能 3.在流水线系统结构中,取指令、执行等操作是( A.顺序 B.转移 C.中断 ) D.重叠 4.重叠机器局部相关的处理方法有两类:推后后续指令对相关单元的读和( A.异步流动 C.设置相关直接通路 B.采用顺序流动 D.调整指令流动的顺序 ) 5.在选择通道方式中,优先级高的磁盘等中高速设备,进行输入输出传送时,适合于采用的 数据宽度是( A.定长块 ) B.单字节 C.可变长块 D.单字加可变长块 6.替换算法要解决的问题是( ) A.用户的虚页如何与主存的实页对应 B.如何用主存的实页号替代多用户的虚页号 C.当页面失效,选择主存中哪个页作为被替换的页 D.新用户要进入主存,选择哪个用户作为被替换的用户 7.下列不是数据流计算特点的是( . A.设置状态 B.没有指令计数器 ) C.没有变量的概念 D.操作结果不产生副作用 8.在尾数下溢处理方法中,平均误差最大的是( A.舍入法 B.截断法 C.恒置“1”法 ) D.ROM 查表法 9.字串位并是指同时对一个字的所有位进行处理,其并行等级( ) A.不存在并行性 B.较高的并行性 C.最高一级的并行性 D.已经开始出现的并行性 10.设 16 个处理器编号分别为 0,1,2,…,15,用 Cube0 互联函数时,与第 13 号处理器机 联的处理器是( A.5 号 ) C.12 号 D.12 号 B.9 号 二、填空题(本大题共 10 小题,每空 1 分,共 20 分) 填空题 本大题共 小题, 11.多处理机程序并行性既存在于______内部,也存在于______外部。 12.一般的说,虚拟机器不一定全部由______实现,有些操作也可用______实现。 13.就流水线计算机而言,主要是通过______,让多个部件在时间上交错重叠地并行执运算 和处理,以实现______。 14.主存空间数相关是指______之间出现对主存同一单元要求______的关联。 15.为提高流水线的______吞吐率,首先要找出______,然后设法消除它。 16.阵列处理机主要通过______实现空间上的并行;多处理机主要通过______实现时间和空 间上的异步并行。 17.动态数据流计算机最主要的特点是让令牌带上______,使得在任意给定的时刻,数据流 程序图任一条弧上允许出现多个带不同______的令牌。 18.中断响应就是允许其中断 CPU______运行,转去对该请求进行预处理,包括保存好 ______,调出有关处理该中断服务程序,准备运行。 19.设多体单字低位交叉的存贮器,单体容量为 I 的 m 个分体,其 Mj 的编址模式为 m×i+j, 其中 i=0,1,…,I-1;j=______,如 m=4,M2 体对应二进制地址码最低二位的状态为______。 20.自定义数据表示包括标志符数据表示和______两类, 标志符应由编绎程序建立, 对______ 程序透明,以减轻应用程序员的负担。 三、简答题(本大题共 5 小题,每小题 6 分,共 30 分) 简答题 本大题共 小题, 21.简述哈夫曼压缩概念的基本思想。 22.RISC 存在不足表现在哪些方面? 23.简述 SIMD 系统的互连网络的设计目标。 24.CPU 写 Cache 时,会发生 Cache 与主存的对应复本内容不一致的现象,解决这个问题有 哪些方法?各需要增加什么开销? 25.简述计算机系统“由中间开始”设计的基本思想。 四、简单应用题(本大题共 2 小题,每小题 10 分,共 20 分) 简单应用题 本大题共 小题, 26.试分析通过何种方法可以解决通用寄存器组数相关的问题?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值