计算机系统结构 期末复习

老师给的重点如下图:

        考试题型为:单选、简答、 计算、分析、论述


第1章 计算机系统结构的基本概念

计算机系统结构、计算机组成和计算机实现的定义:

        计算机系统结构——指传统机器语言程序员所看到的计算机属性,即概念性结构与功能特性。
        计算机组成——指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
        计算机实现——指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 

试用举例说明计算机系统结构,计算机组成与计算机实现之间的相互关系。

答: 如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构;确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成,而选择存储芯片类型、微组装技术、线路设计等属于计算机实现。计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种系统结构可以有多种组成。一种组成可以有多种实现。

 

1. 加快经常性时间

2. Amadahl定律

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的百分比

系统加速比:改进前时间 / 改进后时间

可改进比例Fe,部件加速比Se

3. CPU定能公式

IC:所执行的指令条数

CPI:平均指令周期数

4.局部性原理

把10%放入高速缓存Cache 

CISC复杂指令集计算机, RISC精简指令集优缺点:

CISC:简洁代码;较少寄存器;复杂硬件指令集;

RISC:更多的代码行;较多寄存器;简单硬件指令集。


第2章 计算机指令集结构

简述CISC指令集结构功能设计的主要目标。从当前的计算机技术观点来看,CISC指令集结构的计算机有什么缺点?

        主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。

        缺点: (1)各种指令使用频率相差悬殊。 (2)指令的复杂性带来了计算机体系结构的复杂性,增加了研制时间和成本。 (3)许多复杂指令操作繁杂,运行速度慢。 (4)由于指令功能复杂,不利于采用流水技术来提高性能。

简述RISC指令集结构的设计原则。

        1 指令条数少、功能简单。2 采用简单而统一的指令格式,并减少寻址方式。3

指令的执行在单周期内完成。4 只有load和store指令才能访问存储器。5 以简单有效的方式支持高级语言。


第3章 流水线技术

流水线的分类:

1 单功能流水线与多功能~

2 静态~与动态~

3 部件、处理机级流水线及处理机间流水线

4 线性流水线与非线性~

5 按序~与乱序~

 

流水线冲突

【计算机体系结构】流水线冲突_南方者的博客-CSDN博客

结构冲突解决方法:

① 通过拉开两条冲突指令在流水线之间的距离来避免冲突发生的。

② 通过设置相互独立的存储器(分别存储指令和数据)

数据冲突解决方法:

①定向技术,在某指令产生计算结果之前,其他指令并不真正立即需要该计算结果,如果能够将该计算结果从其产生的地方直接送到其他指令需要他的地方,就可以避免停顿。

②让编译器重新组织指令顺序来消除冲突。

控制冲突:

①最简单的解决方法,冻结或者排空流水线。

②基于编译器的软件方法,预测分支失败,预测分支成功,延迟分支。


 第4章 指令级并行

优化指令集并行方法:

        指令动态调度;动态分支预测技术;多指令流出;指令调度与循环展开;对应CPI;软硬件,动静态。

        指令动态调度:依靠专门硬件对代码实时调度,减少相关导致的停顿

        动态分支预测技术:1 经验建模,预测结果随分支行为变化而变化;2 优点:准确度,适应性

        循环展开:

        1 把循环体的代码复制,多次并按顺序展开,然后调整循环结束条件

        2 执行指令总数变多

        3 要使用不同的寄存器


第5章 存储系统

        加快经常性时间在存储系统里的应用:一个经验是程序执行时间的90%都在执行程序中10%的代码,故利用局部性原理,将局部代码放在高速缓存Cache上,使访存的速度与处理器的速度匹配。

Cache基本工作原理

        CPU要访问存储器系统时,把地址送入主存地址寄存器,主存→Cache转换器部件判定所访问块是否在Cache中,若在,把主存地址转换成Cache块地址放入Cache地址寄存器,块内位移保持不变,用形成地址访问Cache存储器,把所得数据或指令送给CPU;若不在,先判断Cache中是否还有位置,如果没有先替换某个块出去,再访问主存,调入相应块,若继续上述流程。也可以把CPU所要数据或指令直接送给CPU。

访问速度的比值:几十~几百个字节;几千个字节或更大。

Cache系统:解决不快的问题;

虚拟存储系统:解决内存不大的问题。

替换算法有哪几种?它们各有什么优缺点?

答: ①随机法。简单、易于用硬件实现,但这种方法没有考虑Cache块过去被使用的情况,反映不了程序的局部性,所以其不命中率比LRU的高。

②先进先出法。容易实现。它虽然利用了同一组中各块进人Cache的顺序这一“历史"信息,但还是不能正确地反映程序的局部性。

③最近最少使用法LRU。不命中率最低。但是LRU比较复杂,硬实现比较困难。

三种映像规则及其各自优缺点

(1) 全相联(冲突小,Cache失效率低;实现复杂,速度慢)

(2) 直接映像(冲突大,Cache失效率高;实现简单,速度快)

(3) 组映像(结合了前两者的优点)

平均缓存时间 = 命中时间 + 不命中率乘 × 不命中开销

CPU时间 = IC × (CPI执行 + 每条指令的平均访存次数 × 不命中率 × 不命中开销) × 始终周期时间

减少平均缓存时间的18(17)种方法:(第18种不知道在哪)

8种降低不命中率(增加Cache块大小,增加Cache容量,提高相联度,伪相联Cache,硬件预取,编译器控制的预取,编译优化,牺牲Cache)

5种减少不命中开销(两级Cache,让读不命中优先于写,写缓冲合并,请求字处理,非阻塞Cache)

4种减少命中时间(容量小、结构简单的Cache,虚拟Cache,Cache访问流水化,踪迹Cache)

多级Cache使用原因

        为解决CPU与存储器之间性能相差越来越大的问题,利用两级Cache,把第一级Cache做的足够小,使其速度与快速CPU的时钟周期相匹配,同时,通过把第二级Cache做的足够大,使它能捕获更多本来需要到主存进行的访问,从而降低实际不命中开销。


第6章 输入输出系统

I/O系统的慢 如何影响整个计算机系统的功能??

        I/O操作通常是计算机系统中最慢的操作之一。当I/O系统变慢时,会导致CPU等待I/O操作完成,从而浪费CPU的处理能力,导致CPU的利用率下降,甚至可能导致系统崩溃或死机。此外,I/O系统的慢还会影响应用程序的性能,因为应用程序通常需要进行大量的I/O操作。如果I/O系统变慢,应用程序的执行速度也会变慢,从而影响整个计算机系统的功能。因此,保持I/O系统的高效性对于计算机系统的正常运行至关重要。

可靠性计算(我们期末没考)


第7章 互连网络

简单互连函数的计算;网络直径的计算。(期末考了一个选择题算网络直径)

网络直径:指互连网络中任意两个节点之间距离的最大值。

第8章 多处理机

系统结构面临挑战和未来发展趋势

并行处理面临的挑战:

1 程序中有限的并行性。有限的并行性使计算机要达到很高的加速比十份困难;

2 较大的通信开销。主要指多处理机中远程访问的较大延迟。

可能的解决方法:1 采用并行性更好的算法;

2 依靠系统结构来实现,通过编程技术。

3 采用预取或多线程技术来减少延迟。

发展趋势:

1 垂直化趋势。3D集成为芯片设计提供了新的扩展维度,可以从3个维度缩减互联开销,并实现各种混合制造技术的紧密集成;

2 高性能计算、并行计算。随着数据量不断增加,各种应用程序对计算机性能的需求也不断提高,计算机体系结构需要更高的并行计算能力来处理更大规模的数据和模拟,需要更多的处理器核心,更高的时钟频率和更大的内存;

3 量子计算。未来计算机体系结构需要更多的量子比特来支持更大规模的量子计算任务,并且需要更可靠的量子纠错和更高的精度;

4 人工智能。深度学习、机器学习和自然语言处理等人工智能应用;

5 各种新型计算机。

选择题

第1章

第2章

第3章

 

 

  • 8
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值