《计算机体系结构题目.ppt》由会员分享,可在线阅读,更多相关《计算机体系结构题目.ppt(26页珍藏版)》请在人人文库网上搜索。
1、计算机系统结构(2010年春)-基本概念:CPI/阿姆达尔定律,山东大学计算机学院 戴鸿君 ,计算机设计专题,CPI 阿姆达尔定律,2020/7/14,2,CPU的性能 将程序执行的时间进行分解 (1) 计算机工作的时钟频率 计算机系统中与实现技术和工艺有关的因素。 单位是MHz(f)。 (2) 总时钟周期数,程序执行的cpu时间 :,CPU时间 = 总时钟周期数 / 时钟频率,“指令时钟数”CPI(Cycles Per Instruction) 一个与计算机体系结构有关的参数。,CPI = 总时钟周期数 / IC,程序执行的CPU时间可以写成 总CPU时间 = CPI IC / 时钟频率, 。
2、时钟频率:反映了计算机实现技术、生产工艺 和计算机组织。,IC:程序执行过程中所处理的指令数。, CPI:反映了计算机实现技术、计算机指令集 的结构和计算机组织。 IC:反映了计算机指令集的结构和编译技术。,假设:计算机系统有n种指令; CPIi :第i种指令的时钟周期数; Ii :在程序中第i种指令出现的次数; 则程序执行时间为 CPU时间 = (CPIi Ii) / 时钟频率 即得: CPI = (CPIi Ii) / IC = (CPIi Ii / IC) 其中:(Ii / IC)反映了第i种指令在程序中所占的 比例。,i=1,i=1,i=1,n,n,n,对CPU性能公式进行进一步细化,。
3、定量指标,反映程序的运行速度 MIPS(Million Instructions Per Second,每秒百万条指令数) MFLOPS(Million Floating Point Operations Per Second,每秒百万次浮点运算),计算机设计专题,CPI 阿姆达尔定律,2020/7/14,7,计算机系统定量设计原理,三条基本原则和方法:,(1)哈夫曼(Huffman)压缩定理 对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。 这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能明显提高整个系统的性能。 (2)Amda。
4、hl定律 加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。,1) 加速比,系统加速比依赖于两个因素: 可改进比例fnew:可改进部分在原系统计算时间中所占的 比例,它总是小于等于的。 例如: 一个需运行60秒的程序中有20秒的运算可以 加速,那么该比例就是20/60。,系统加速比Sp = =,部件加速比rnew:可改进部分改进以后的性能提高, 一般情况下它是大于的 。 例如: 系统改进后执行程序,其中可改进部分花 费2秒的时间,而改进前该部分需花费5秒, 则性能提高为5/2。 总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间,总执行时间改。
5、进后=(1-可改进比例fnew)总执行时间改进前 + = (1-可改进比例fnew) + 总执行时间改进前,系统加速比为改进前与改进后总执行时间之比: 系统加速比Sp = =,2) Amdahl定律:性能递减规则 如果仅仅对计算机中的一部分做性能改 进,则改进越多,系统获得的效果越小。 推论:如果只针对整个任务的一部分进行优化, 那么所获得的加速比不大于1/(1-fnew)。 3) 一个“好”的计算机系统:具有高性价比的计 算机系统是一个带宽平衡的系统,而不是看它 使用的某些部件的性能 。,(3)程序的局部性原理 程序在执行时所访问地址的分布不是随机 的,而是相对地簇聚;这种簇聚包括指令和数 。
6、据两部分。 程序的时间局部性:程序即将用到的信息很 可能就是目前正在使用的信息。 程序的空间局部性:程序即将用到的信息很 可能与目前正在使用的信息在空间上相邻或者 临近。 存储器体系的构成就是以访问的局部性原理为基础的。,CPU时间,CPI = 总时钟周期数 /指令数 总CPU时间 = CPI 指令数/ 时钟频率 总CPU时间 = (CPIi Ii) / 时钟频率 Ii :在程序中第i种指令出现的次数 CPI = (CPIi Ii) /指令数,2020/7/14,15,Amdahl定律,2020/7/14,16,2020/7/14,17,假设我们考虑条件分支指令的两种不同设计方法如下:(1) 。
7、CPU1:通过比较指令设置条件码,然后测试条件码进行分支;(2)CPU2:在分支指令中包括比较过程。 在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。 由于CPU1在分支时不需要比较,因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU更快? 如果CPU1的时钟周期时间仅仅比CPU2快1.1倍,哪一个CPU更快呢?,2020/7/14,18,用一台40MHZ处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:,求有效CPI、MIPS速率。
8、和程序的执行时间,2020/7/14,19,如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33; FPSQR操作的比例为2%, FPSQR的CPI为20。 FPSQL操作属于FP操作的一部分。 假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。 试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。,2020/7/14,20,假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%, 采用加快措施后能使整个系统的性能提高多少?,2020/7/14,21,2。
9、005年11月考试题目 在计算机系统中,某一功能的处理时间为整个系统运行时间的50%,若使该功能的处理速度加快10倍,根据Amdahl定律,这样做可以使整个系统的性能提高__(43)__倍。若要使整个系统的性能提高1.5倍,则该功能的处理速度应加快__(44)__倍。 (43)A. 1.6 B. 1.7 C. 1.8 D. 1.9 (44)A. 3 B. 5 C. 7 D. 8,2020/7/14,22,如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用标量方式求解部分所花费时间占总的时间的百分比为可向量化百分比请画出加速比与可向量化比例两者之间关系的曲线 为获得采用向量方式最大。
10、加速比的半值(即10)时,所需可向量化的百分比为多少? 某程序可向量化部分70%。向量处理速度加倍(即40)和向量工作方式的百分比增大多少使性能得到同样提高?,2020/7/14,23,某台计算机只有Load/Store 指令能对存储器进行读/写操作,其它指令只对寄存器进行操作。根据程序跟踪实验结果,已知每种指令所占的比例及CPI数如下: 指令类型 指令所占比例 CPI 算逻指令 43 1 Load指令 21 2 Store指令 12 2 转移指令 24 2 (1) 求上述情况下的平均CPI。 (2) 假设程序有M条指令组成。算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在。
11、算逻指令执行前用Load指令从存储器取到寄存器。因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器存储器类型,假设这种指令的CPI等于2。同时,转移指令的CPI变为3。求新指令系统的平均CPI。,2020/7/14,24,假设在一台40MHZ处理机上运行200,000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下: 指令类型 CPI 指令混合比 算术和逻辑 1 60% 高速缓存命中的加载/存储 2 18% 转移 4 12% 高速存储缺失的存储器访问 8 10% (a) 计算在单处理机上用上述跟。
12、踪数据运行程序的平均CPI。 根据(a)所得的CPI,计算相应的MIPS速率。 求20000条代码的运行时间。,2020/7/14,25,采用哪种实现技术来求浮点数平方根的操作对系统的性能影响较大。 一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍,假设FPSQR操作占整个测试程序执行时间的20%。 另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。 请比较这两种设计方案。,开放式问答题,搜索目前最新的一款PC上使用的CPU的性能参数,以体系结构的视角进行描述 从摩尔定律、阿姆达定律出发,讨论此款CPU相对于以往CPU性能提升的原因。,2020/7/14,26。