清华计算机系统结构,清华第2版《计算机系统结构》习题解答.doc

a7f4a3f590493a1e451dd952a488fd7c.gif 清华第2版《计算机系统结构》习题解答.doc

(17页)

05810a25da9ac9f0f106a249bcd5b2b1.gif

本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!

9.90 积分

《计算机系统结构》习题解答目录第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)第八章(P498)8.12(SISD/SIMD算法)第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。)第一章(P33)1.7(1)从指定角度来看,不必要了解的知识称为透明性概念。(2)见下表,“√”为透明性概念,“P”表示相关课文页数。模m交叉,√,浮点数据,×,P4通道与I/O处理机,×,P4总线宽度,√,阵列运算部件,√,结合型与独立型通道,√,单总线,√,访问保护,×,中断,×,指令控制方式,√,堆栈指令,×,最小编址单位,×,Cache存储器,√,1.8见下表,“√”为透明性概念,“P”表示相关课文页数。指令地址寄存器,×,指令缓冲器,√,时标发生器,√,条件码寄存器,×,乘法器,√,主存地址寄存器,√,磁盘,×,先行进位链,√,移位器,√,通用寄存器 ,×,中断字寄存器,×,1.9见下表,“√”表示都透明,“应”表示仅对应用程序员透明,“×”表示都不透明。数据通路宽度,√,虚拟存储器,应,Cache存储器,√,程序状态字,×,“启动I/O”指令,应,“执行”指令,×,指令缓冲寄存器,√,Sn20 1 0 1 Fe1.12 已知Se=20 , 求作Fe-Sn关系曲线。 将Se代入Amdahl定律得1.13 上式中令Sn=2,解出Fe=10/19≈0.5261.14 上式中令Sn=10,解出Fe=18/19≈0.9471.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.7≈3.1496(两种方法得到的相同性能)(2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/38≈0.7184(第二种方法的百分比)(3)结论:软件组方法更好。因为硬件组需要将Se再提高100%(20→40),而软件组只需将Fe再提高1.84%(0.7→0.7184)。1.17 1.18 记f ── 时钟频率,T=1/f ── 时钟周期,B ── 带宽(Byte/s)。 方案一: 方案二:1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。(1)(2)(3)1.21(1)(2)1.24 记Tc ── 新方案时钟周期,已知CPI = CPIi = 1原时间 = CPI × IC × 0.95Tc = 0.95IC×Tc新时间 = (0.3×2/3+0.7)× IC × Tc = 0.9IC×Tc二者比较,新时间较短。第二章(P124)2.3(忽略P124倒1行 ~ P125第8行文字,以简化题意)已知2种浮点数,求性能指标。 此题关键是分析阶码、尾数各自的最大值、最小值。 原图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。 由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“±最大绝对值”回答;最小正数与最大负数的绝对值相同,可用“±最小绝对值”回答。 第1小问中,阶码全部位数为8,作无符号数看待真值为0~255,作移-127码看待真值为-127~+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0 – 2-23,有效位数p=24; 第2小问中,阶码全部位数为11,作无符号数看待真值为0~2047,作移-1023码看待真值为-1023~+1024;尾数(不计符号位)有52位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0 – 2-52,有效位数p=53。 最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。32位64位±最大绝对值±(1-2-24)·2129±(1-2-53)·21025±最小绝对值±2-127±2-1023表数精度δ2-242-53表数效率η100%100%2.5(1) rm = 2,re = 2,p = 24(隐藏最高位),q = 7。(2) Nmax = 1.7×1038,-|N|min = -1.47×10-39 δ ≤ 5.96×10-8 ≈ 10-7.22,η = 100%2.61位7位6位00111111333333(1) 0.2 = 0.333333H×160 设阶码为移-63码(即-26+1,原题未指明) 0.2 = 0.110011001100110011001101B×2-2 1位8位23位00111110110011001100110011001101 (其中最高有效位需隐藏) 阶码为移-127码(即-27+1)(2) 符号位不变,(阶码 – 63)×4 + 127;尾数左规,除去最高位;(3) 符号位不变,(阶码 – 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补0。2.13 已知10条指令使用频度,求3种编码方法的平均码长与信息冗余量。(1)此问中的“最优Huffman编码法”实际是指码长下限,即信源的平均信息量──熵,代公式得H=2.9566。(2)Huffman编码性能如下表;(3)2/8扩展编码是8/64/512法的变种,第一组2条指令,码长为2(1位扩展标志,1位编码),第二组8条指令,码长为4(1位扩展标志,与第一组区别,加3位编码),编码性能如下表;(4)3/7扩展编码是15/15/15法的变种,第一组3条指令,码长为2(共有4种组合,其中3种组合分。省略部分。 01000101 01010110 01100111 01111000 10001001 10011010 10101011 10111100 11001101 11011110 11101111 11117.27(1) 已知N = 64,n = 6,源结点s = 101101B,目的结点d = 011010B,方向矢量r = s⊕d = 110111B,以低维度优先顺序寻径,路径为 s = 101101B → 101100B → 101110B → 101010B → 111010B → 011010B = d (下划线为当前寻径维)(2) 求给定无向图中2棵选播树(即生成树)。 (i) 求最小成本生成树(通道数最少),可考虑Prim算法、Kruskal算法或标记法。一个参考操作方法是:先对临近结点群分别构造最短子树,然后在子树之间作最短互连。 (ii) 求由结点(3,5)出发的单源最短路径生成树(各距离最短),可考虑贪心算法。对X-Y网格图来说,从树根到某一树叶的任何路径只要在各维均无反向移动即为最短路径(满足此条件的最短路径有多条)。要得到单一树根对于多片树叶的综合最短路径,可以先分别作出各条单播最短路径,然后在不增加各路径长度的前提下,尽可能地进行路段合并。 0,7 1,7 2,7 3,7 4,7 5,7 6,7 7,7 0,6 1,6 2,6 3,6 4,6 5,6 6,6 7,6 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 0,4 1,4 2,4 3,4 4,4 5,4 6,4 7,4 0,3 1,3 2,3 3,3 4,3 5,3 6,3 7,3 0,2 1,2 2,2 3,2 4,2 5,2 6,2 7,2Y 0,1 1,1 2,1 3,1 4,1 5,1 6,1 7,1 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 X 这两小问结果如下图所示(其中b图第一步必须选择向下,而不能向右)。 0,7 1,7 2,7 3,7 4,7 5,7 6,7 7,7 0,6 1,6 2,6 3,6 4,6 5,6 6,6 7,6 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 0,4 1,4 2,4 3,4 4,4 5,4 6,4 7,4 0,3 1,3 2,3 3,3 4,3 5,3 6,3 7,3 0,2 1,2 2,2 3,2 4,2 5,2 6,2 7,2Y 0,1 1,1 2,1 3,1 4,1 5,1 6,1 7,1 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 X (a) (b)(3) 求作超立方体贪心选播树。7.29 已知N = 256,n = 8,起始结点编号j = 123 = 01111011B。根据混洗函数的循环移位性质,Shuffle10(j) = Shuffle2(j) = 11101101B = 237第八章(P498)8.12 问题为S=A1×B1+……+A32×B32,其中T乘=4Δt,T加=2Δt,T传=1Δt。(1) 在串行计算机上,各操作不论是否相关均不能重叠,总时间恒等于各操作单独时间之和,所以不必考虑运算顺序。T=32·T乘+31·T加=(32×4+31×2)Δt=190Δt(2) 设此双向环可以并行传送(即为“移数环”,因为SIMD系统各种数据操作都能并行)。 按平均分配原则,每个结点内有4对数据。 首先在各结点用串行算法它们的相乘与求和,需时T1=4·T乘+3·T加=(4×4+3×2)Δt=22Δt; 然后用二叉树并行算法将8个结点中的部分和相加(见下图),其中并行加法需3次,每次时间相同,而并行传送3次的每次时间却随距离倍增,依次为1、2、4步,所以有T2=(1+2+4)·T传+3·T加=(7×1+3×2)Δt=13Δt; 总时间T=T1+T2=35Δts = s1 + s2 + s3 + s4 + s5 + s6 + s7 + s8①.右传20步 加法1步②.右传21步 加法1步③.右传22步 加法1步第九章(P562)9.18 问题为S=(A1+B1)×……×(A8+B8),其中T加=30ns,T乘=50ns,T传=10ns。 将加法记为任务1-8,乘法记为任务9-15。(1) 在串行计算机上,同8.12题1问分析,共计15步运算,T=8·T加+7·T乘=(8×30+7×50)ns=590ns。(2) 多功能部件SISD计算机的工作方式可参考P346题18(3)。 为了充分利用加法器与乘法器的可并行性,尽量让加法与乘法交替进行,可自左向右顺序运算(见下图)。T=2·T加+7·T乘=(2×30+7×50)ns=410ns 15 8 14 7×50ns A8 B8 7 13 乘法 9 10 11 12 15 加法 1 2 3 4 5 6 7 8 A7 B7 8×30ns 9 2 1 A2 B2 A1 B1(3) 同8.12题2问,设单向环可以并行传送(即为“移数环”,理由同8.12题2问)。 1 2 3 4 5 6 7 8 10 20 40 2 4 6 8 传送 4 8 乘法 50 50 50 8 加法 30T=T加+3·T乘+(1+2+4)·T传=(30+3×50+7×10)ns=250ns(4)在全互连网络上,任意两个结点之间的距离均为1步,所以任何置换都能在1步完成,故 10 10 10 传送 乘法 50 50 50 加法 30T=T加+3·T乘+(1+1+1)·T传=(30+3×50+3×10)ns=210ns 关 键 词: 解答 习题 计算机系统结构 清华

4d91c43bfc72ca913299809b07b4968f.gif  天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值