计算机系统结构每章重点及知识点补充

最新推荐文章于 2024-03-07 10:18:36 发布

咕咕咕不咕

最新推荐文章于 2024-03-07 10:18:36 发布

阅读量487

点赞数 1

分类专栏：计算机系统结构文章标签：经验分享

本文链接：https://blog.csdn.net/weixin_45868623/article/details/118295703

版权

计算机系统结构专栏收录该内容

1 篇文章 0 订阅

订阅专栏

计算机系统结构每章重点及知识点补充
第一章计算机系统结构的基本概念
(1) 计算机系统结构的定义及研究对象
(2) 计算机系统的层次结构
(3) 评价计算机指令执行速度的经典方法
(4) 透明性、系列机、兼容性、MIPS, FLOPS, CPI/IPC, VLSI等概念
(5) Amdahl定理与CPU性能公式
(6) Flynn分类法

计算机系统的层次结构
第6级专用应用语言机器特定应用用户（使用特定应用语言）
（经应用程序翻译成高级语言）
第5级通用高级语言机器高级语言程序员（使用通用高级语言）
（经编译程序翻译成汇编语言）
第4级汇编语言机器汇编语言程序员（使用汇编语言）
（经汇编程序翻译成机器语言、操作系统原语）
第3级操作系统语言机器操作系统用户（使用操作系统原语）
（经原语解释子程序翻译成机器语言）
第2级传统机器语言机器传统机器程序员（使用二进制机器语言）
（由微程序解释成微指令序列）
第1级微指令语言机器微指令程序员（使用微指令语言）
（由硬件译码器解释成控制信号序列）
第0级硬联逻辑硬件设计员
摩尔定律：每隔3年芯片的集成度翻两番。
时间局部性：最近访问过的代码在很短的时间内有可能被再次访问；主要对应于循环语句；
空间局部性：与刚被访问过的指令或数据相邻的指令或数据有可能马上被访问；主要对应于顺序执行的语句。
访问的局部性原理是构成层次化存储系统的理论基础。
FLOPS：每秒所执行的浮点运算次数。
现代处理机对冯·诺依曼结构的改进：
不变的：存储程序
改变的：存储器为中心，分散控制
什么是非冯计算机？非指令驱动
第二章指令系统
(1) 数据表示
(2) 浮点数的三大性能和设计方法
(3) 指令格式的优化设计（操作码优化编码）
(4) CISC存在的问题
(5) RISC特点及关键技术
数据表示：指计算机硬件能够直接识别与处理的数据类型。
数据类型：计算机处理数据对象的机内表示。
第三章存储系统
(1) 存储系统的定义及主要性能。
(2) 并行存储器的工作原理。（低位交叉和高位交叉）
(3) 堆栈型替换算法定义。
(4) Cache存储系统的地址映象及变换方法。
(5) Cache存储系统的块替换算法。
(6) Cache存储系统的加速比和一致性问题。
第四章输入输出系统
(1) 了解三种基本输入输出方式的原理及特点
(2) 中断系统中的软硬件功能分配
(3) 中断处理过程
(4) 中断优先级和中断屏蔽的原理及方法
(5) 通道中的数据传送过程与流量分析
三种基本输入输出方式的原理及特点：
(1) 程序控制输入输出方式
定义：也称状态驱动输入输出方式、应答输入输出方式、查询输入输出方式、条件驱动输入输出方式
特点：

何时对哪个设备进行输入输出操作完全受CPU控制
CPU要通过指令对设备进行测试才能知道设备的工作状态：空闲、准备就绪、忙碌等
数据的输入和输出都要经过CPU
用于连接低速外围设备，如终端、打印机等
(2) 中断输入输出方式
定义：当出现来自系统外部，机器内部，甚至处理机本身的任何意外的，或虽然是事先安排的，但出现在现行程序的什么地方是事先不知道的事件时，CPU暂停执行现行程序，转去处理这些事件，等处理完成后再返回来继续执行原先的程序。
特点：
CPU与外围设备能够并行工作。
能够处理例外事件。
数据的输入和输出都要经过CPU。
用于连接低速外围设备。
(3) 直接存储器访问方式
定义：
主要用来连接高速外围设备。如磁盘存储器等。
特点：
外围设备的访问请求直接发往主存储器，数据的传送过程不需要CPU的干预。
全部用硬件实现，不需要做保存现场和恢复现场等工作。
DMA控制器复杂，需要设置数据寄存器、设备状态或控制寄存器、主存地址寄存器、设备地址寄存器和数据交换个数计数器及控制逻辑等。
在DMA方式开始和结束时，需要处理机进行管理。

中断处理过程
(1) 现行指令结束，且没有更紧急的服务请求
(2) 关CPU中断
(3) 保存断点，主要保存PC中的内容
(4) 撤消中断源的中断请求
(5) 保存硬件现场，主要是PSW及SP等
(6) 识别中断源
(7) 改变设备的屏蔽状态
(8) 进入中断服务程序入口
(9) 保存软件现场，在中断服务程序中使用的通用寄存器等
(10) 开CPU中断，可以响应更高级别的中断请求
(11) 中断服务，执行中断服务程序
(12) 关CPU中断
(13) 恢复软件现场
(14) 恢复屏蔽状态
(15) 恢复硬件现场
(16) 开CPU中断
(17) 返回到中断点
第五章标量处理机
(1) 采用先行控制方式处理机的结构，各个缓冲栈的作用；
(2) 线性流水线的性能分析及计算；
(3) 非线性流水线的调度方法；
(4) 数据相关、控制相关的定义；
(5) 超标量处理机、超流水线处理机的基本概念。
标量处理机：只有标量数据表示和标量指令系统（机器指令级）的处理机。(高级语言中的向量数据和向量指令在编译时转换为标量表示)。
并行技术
(1) 采用操作级、指令级并行技术
(2) 线程及以上级(进程、程序等)并行
标量处理机主要通过采用流水线技术提高执行速度
通过使用先行控制技术，可以显著提高流水线的效率
采用二次重叠执行方式必须解决两个问题：
(1)有独立的取指令部件、指令分析部件和指令执行部件：把一个集中的控制器，分解成三个独立的控制器：存储控制器、指令控制器、运算控制器。
(2)要解决访问主存储器的冲突问题：取指令、分析指令、执行指令都可能要访问存储器。
采用先行控制技术的关键是缓冲技术和预处理技术。
各个缓冲栈的作用
先行指令缓冲栈：预先读出的指令
先行读数缓冲栈：预先读出的数据
先行操作栈：预处理指令
后行写数栈：等待写回存储器的结果
RR型指令，不必处理，直接送先行缓冲栈
RS型指令，主存有效地址送先行读数栈，用该先行读数栈的寄存器编号替换指令中的主存地址码部分，形成RR指令送先行缓冲栈
RI型指令，指令中的立即数送先行读数栈，用该先行读数栈的寄存器编号替换指令中的立即数部分，形成RR指令送先行缓冲栈
先行指令缓冲栈的设计
假设缓冲深度为DI，考虑两种极端情况：
(1)先行指令缓冲栈已经充满，指令流入的速度最慢。
(2)先行指令缓冲栈原来为空，输出端指令流出的速度最慢。
第七章互连网络
(1) 六种基本互连函数；
(2) 多级立方体互连网络的构成及其工作原理；
(3) 四种寻径方式的原理及优缺点。
互连网络的种类：
(1) 静态互连网络：连接通路是固定的，不能直接实现任意结点到结点之间的互连。
(2) 循环互连网络：通过多次重复使用同一个单级互连网络以实现任意结点到结点之间的互连。
(3) 多级互连网络：由多级交换开关按照特定的互连模式将多套单级互连网络连接起来，实现任意结点到结点之间的互连。
(4) 全排列互连网络：能够同时实现任意结点到结点之间的多级互连网络。
(5) 全交叉开关网络：以交叉开关为核心组建的动态互连网络，能够同时实现任意结点到结点之间的互连，能够实现广播和多播。
多级立方体互连网络的构成及其工作原理；
构成：
(1) 交换开关
(2) 交换开关之间的拓扑连接
(3) 对交换开关的不同控制方式
工作原理：
对于网络内三级拓扑结构，第一级互连实现低两位互换，第二级实现最低和最高两位互换，第三级实现循环右移一位；开关处于交换状态相当于最低位取反。从整个网络的输入和输出关系来看，某级开关处于交换相当于某位取反，实现立方体函数。
四种寻径方式的原理及优缺点：
(1) 线路交换(circuit switch)：
先建立一条从源结点到目的结点的物理通路，然后传递消息。
优点：实际通信时间较短，使用缓冲区少。
缺点：建立物理通路的开销很大，占用物理通路的时间长。
(2) 存储转发(store and forward)
每个结点有一个包缓冲区，包从源结点经过中间结点到达目的结点。存储转发网络的时延与源和目的地之间的距离成正比。
优点：占用物理通路的时间比较短。
缺点：包缓冲区大，时延大（与结点距离成正比）。
(3) 虚拟直通(virtual cut through)
当接收到用作寻径的消息头部时，即开始路由选择。当出现寻径阻塞时，只能将整个消息存储在寻径结点中。
优点：通信延迟与结点数无关。
缺点：每个结点需要有足够大的缓冲区。在最坏的情况下与存储转发方式的通信时延相同，经过的每个结点都阻塞，都需要缓冲。
(4) 虫蚀寻径(wormhole)
把包分成更小的片。每个结点的寻径器中设置有片缓冲区。用头片直接开辟一条从输入结点到输出结点的路径。每个消息中的片以流水方式在网络中向前“蠕动”。
当消息的头片到达一个结点的寻径器后，寻径器根据头片的寻径消息立即做出路由选择。如果所选择的通道或结点的片缓冲区不可用时，头片必须在该结点的片缓冲区中等待，其它数据片也在原来的结点上等待。
优点：每个结点的缓冲区较小。较低的网络传输时延；通道共享性好，利用率高；易于实现选播和广播通信方式。
缺点：当消息的一个片被阻塞，整个消息都被阻塞。
第九章多处理机
(1) 多处理机特点；
(2) 多处理机通信基本模型的计算；
(3) Cache一致性的两种方法。
多处理机定义：
两个或两个以上处理机(包括PU和CU)，通过高速互连网络连接起来，在统一/分散独立的操作系统管理下，实现指令以上级（任务级、作业级）并行。
多处理机分类：
按照处理机连接的紧密程度：紧密偶合和松散偶合多处理机；
按照是否共享主存储器：共享存储器和分布存储器多处理机；
按照处理机类型：同构型和异构型多处理机。
按照PE与IOP之间互连方式：对称型：每个IOP能够连接到所有PE上
非对称型：每个IOP只与一个PE连接。
冗余对称型：一个PE与多个IOP连接。
并行性在很大程度上依赖于R/C比值。
R/C是衡量任务粒度(Granularity)的尺度。（R:程序执行时间，C:通信开销）
细粒度并行：R/C小，通信开销大。
粗粒度并行：R/C大，通信开销小。
两种选择：
(1) 把作业分解成较大的块，能得到较大的R/C，通讯时间少，但计算时间长，同时使用的处理机少；
(2) 把作业分解成较小的块，能得到较小的R/C，计算时间短，同时使用的处理机多；但通讯的开销较大。
两类解决多个Cache不一致性问题的协议：
(1) 在总线互连的多处理机系统中，通常采用监听协议。
(2) 在非总线结构的多处理机系统中，通常采用基于目录协议。
两种监听协议：
方法1：写无效（Write Invalidate）策略，在本地Cache的数据块修改时使远程数据块都无效；
方法2：写更新（Write Update）策略，在本地Cache数据块修改时通过总线把新的数据块广播给含该块的所有其他Cache。