计算机系统系统结构----基本概念(笔记)

不想再抄代码的打工人

已于 2023-07-17 14:36:07 修改

阅读量888

点赞数 1

文章标签：笔记嵌入式硬件

于 2023-07-09 18:06:16 首次发布

本文链接：https://blog.csdn.net/weixin_42951246/article/details/131623843

版权

计算机系统系统结构----基本概念

计算机系统的层次结构

计算机系统的层次结构

在下述的6级层次结构中，通常L0-L2是用解释的方法实现，而L3-L5是用翻译的方法实现。
在这里插入图片描述

翻译和解释

在计算机科学中，翻译和解释是两种常见的编程语言处理方法。

翻译通常指的是将一种高级编程语言（如C、Java等）的代码转换成机器可以执行的低级指令或二进制代码的过程。这个过程包括编译和链接两个主要阶段。编译器会将源代码逐行转换为中间代码（如汇编语言），再通过汇编器将中间代码转换为可执行的机器代码。链接器则将各个模块的机器代码合并成最终可执行文件。翻译的结果是生成一个独立的可执行文件，它可以在不同的计算机上运行。

解释则是另一种处理方法，它将源代码逐行解释执行而无需提前编译成机器代码。解释器会读取源代码，并逐行解释为机器指令执行。解释器动态地执行代码，每执行一行代码就进行相应的操作。这意味着解释型语言的代码可以直接在不同的系统上执行，无需经过翻译步骤。但由于解释执行需要实时转换和执行代码，所以解释通常比翻译的方式慢一些。

翻译和解释有各自的优缺点。翻译生成的机器代码执行效率高，适合长时间运行的程序，但需要在每次修改后重新编译；解释则更加灵活，可以进行交互式编程和动态调试，但速度相对较慢。因此，在选择编程语言时，可以根据具体需求和应用场景来决定是采用翻译还是解释的方式来处理代码。

翻译和解释是语言实现的两种基本技术。其共同点都是以执行一串工级指令來实现 L+1 级指令。其不同点在于：翻译技术是先把 L+1级程序全部变换成工级程序后,再去执行新产生的山级程序，在执行过程中 L+1级程序不再被访问;而解释技术则是每当一条L+1 级指令被译码后，就直接去执行一串等效的L级指令，然后再去取下一条L+1级的指令，依此重复进行。这两种技术都被广泛使用。一般来说，解释执行比编译后再执行所花的时间多，但占用的存储空间较少。

CPU性能公式

CPU 时间=ICxCPIx时钟周期时间
其中,IC 为所执行的指令条数，CPI(Cycles Per Instruction，即每条指令的平均时钟周期数)。
根据这个公式可知，CPU 的性能取决于以下3个参数。
①时钟周期时间：取决于硬件实现技术和计算机组成。
②CPI：取决于计算机组成和指令集结构。
③IC：取决于指令集结构和编译技术。
用书中例题理解上述概念：

例1.3 假设考虑条件分支指令的两种不同设计方法。
①CPUa：通过比较指令设置条件码，然后测试条件码进行分支。
②CPUb：在分支指令中包括比较过程。
在这两种CPU中，条件分支指令都占用2个时钟周期，而所有其他指令占用1个时钟周期。对于CPUa，执行的指令中分支指令占20%;由于每条分交指令之前都需要有比较指令，因此比较指令也占20%。 由于CPUa在分支时不需要比较，因此CPUb的时钟周期时间会是CPUa的1.25倍。问：哪一个CPU 更快？如果CPUb的时钟周期时间只是CPUa的1.1倍，哪一个 CPU 更快？

首先根据CPU性能公式：CPU 时间=ICxCPIx时钟周期时间，由于IC与对应CPU时钟周期时间是未知，所以先求对应的CPI，而根据书中提到的CPI另一种表达形式：
在这里插入图片描述
则可以推出：

CPIa=0.2x2+0.8x1=1.2
//则可暂时将CPUa的性能公式表达为：CPUa=ICa x 1.2 x 时钟周期a

由条件可知

时钟周期b=1.25 x 时钟周期a
ICb=0.8 x ICa //因为CPUb不执行单独的比较指令，也正因如此CPUb中分支指令占比为20%/80%=25%则
CPIb=0.25 x 2 +0.75 x 1= 1.25
//则CPUb的性能表达公式表达为：
CPUb=ICb x 1.25 x 时钟周期b=0.8 x ICa x 1.25 x (1.25 x 时钟周期a)=1.25 x 时钟周期a x ICa

所以根据此容易得出答案，在假设的条件下，CPUb虽然执行的指令条数较少，但CPUa的时钟周期更短，所以CPUa快，而改变条件为1.1倍的条件下，CPUb比CPUa运行更快。

冯·诺依曼结构

在这里插入图片描述

改进——输入、输出方式（DMA方式）

DMA（Direct Memory Access）技术是一种计算机数据传输的方式，允许外设设备直接访问主存储器而无需通过中央处理器（CPU）的干预。
传统上，当外设设备（如硬盘驱动器、网卡等）需要读取或写入数据到内存时，数据必须通过CPU来传输。这涉及将数据从外设设备读取到CPU寄存器，然后再将数据从CPU寄存器写入内存。这个过程需要消耗CPU的时间和资源。
使用DMA技术，外设设备可以直接访问系统内存，绕过CPU，从而实现更快速、高效的数据传输。DMA控制器负责管理数据传输的操作，它将数据从外设复制到内存或从内存复制到外设，而不需要CPU进行介入。
DMA技术广泛应用于各种领域，如磁盘IO、网络数据传输、音频和视频流处理等，可以提升系统性能并减少CPU的工作负担。

改进——输入、输出方式（IO处理机）

IO处理机（I/O Processor）是一种专用的硬件设备，用于处理输入/输出（I/O）操作。它独立于主CPU，并负责管理和执行与外部设备之间的数据传输和通信。
在x86体系结构的主板上，IO处理机通常包含在南桥芯片组（Southbridge）中。
南桥芯片组是主板上的一个重要组成部分，负责连接CPU、内存、扩展槽和各种外部设备，以及处理与这些设备之间的数据传输和控制。它集成了许多I/O功能和接口，其中包括IO处理机。
IO处理机在南桥芯片组中有多个功能模块，用于管理和执行与外部设备的数据传输和通信。这些功能模块通常包括以下几个方面：

I/O控制器：负责管理和控制各种I/O设备，如硬盘驱动器、USB端口、串口、并口等。它处理I/O请求、数据传输以及对外部设备的控制信号。
DMA控制器：负责直接内存访问（DMA）的操作，可以实现高速数据传输，减轻CPU的负担。它允许外部设备直接与系统内存交换数据，而无需通过CPU的介入。
中断控制器：负责处理外部设备发出的中断请求，并将其通知给CPU进行相应的处理。它协调和管理中断信号在系统中的传递，确保正确的中断处理顺序和优先级。
时钟和定时器：提供系统时钟和定时器功能，用于计算和同步各个设备的时序和时间。

需要注意的是，随着技术的发展，一些新的主板设计中可能会将部分IO处理机的功能集成到CPU芯片或其他外围芯片上，而不是完全集中在南桥芯片组中。这样可以提高系统性能和效率。
总之，IO处理机通常位于主板上的南桥芯片组中，用于管理和执行与外部设备的数据传输、通信和控制。它包含了多个功能模块，如I/O控制器、DMA控制器、中断控制器和时钟/定时器。

CPU通用寄存器和高速缓冲存储器的存在意义

CPU的通用寄存器和高速缓存存储器在计算机系统中具有重要的存在意义，它们对于提高计算机的性能和执行效率起到了关键作用。

通用寄存器（General Registers）：

数据存储：通用寄存器是CPU内部的存储单元，用于暂时存储和处理指令操作数、中间结果和其他临时数据。它们提供了快速的读写操作，可以直接在CPU内部进行数据处理，避免频繁地与主存进行数据交换。
快速访问：通用寄存器位于CPU内部，访问速度非常快，比访问内存的速度高几个数量级。通过使用寄存器，CPU可以迅速读取和写入数据，减少了对主存的访问延迟。
执行效率：通用寄存器的存在使得CPU能够更高效地执行指令，减少了指令执行所需的时钟周期数。CPU可以在寄存器之间进行快速数据传输和操作，提高了运算速度和整体执行效率。

高速缓存存储器（Cache Memory）：

数据缓存：高速缓存存储器是位于CPU内部的一种更快速的存储器层次结构，用于临时存储主存中频繁使用的数据和指令。它通过在CPU与主存之间建立一个数据缓冲区，可以快速提供所需的数据。
数据局部性：程序执行过程中，存在着局部性原理，即访问的数据和指令往往集中在局部区域内。高速缓存存储器利用这一原理，提前将可能会被频繁使用的数据和指令复制到更快的存储器中，以减少对主存的访问次数，从而提高访问速度和执行效率。
访存调度：高速缓存存储器通过使用不同的缓存行和缓存替换策略来优化数据访问。常用的缓存替换算法如最近未使用（LRU）和随机替换。这些调度策略可以使得缓存存储器更有效地处理数据的读取和写入。

通用寄存器和高速缓存存储器的存在意义在于提供了快速的数据存储和访问机制，以优化计算机系统的性能。它们可以减少CPU与主存之间的数据交换次数，降低存储器访问延迟，并提高指令执行效率。通过合理利用和设计这些存储单元，可以显著提升计算机的整体性能和响应速度。

怎么理解计算机中同时性和并发性这两个概念

在计算机科学中，同时性（Concurrency）和并发性（Parallelism）是两个相关但不完全相同的概念。
同时性是指计算机系统中可以同时执行多个独立任务的能力。它强调的是任务之间的逻辑上的独立性，即这些任务可以独立地被执行，彼此之间的执行不会相互影响。同时性可以通过多任务处理、多线程、事件驱动编程等方式来实现。
例如，在一个操作系统中，可以同时运行多个应用程序，每个应用程序都有自己的独立执行流程，并且互不干扰。这种同时性的实现使得用户可以同时进行多项任务，提高了系统的效率和响应性。
并发性则是指计算机系统中同时执行多个任务的能力。与同时性不同的是，并发性强调任务的物理上的同时性执行，即多个任务在同一时刻真正地并行执行在不同的处理器核心、线程或计算资源上。并发性通常需要硬件的支持，比如多核处理器、分布式系统等。
例如，现代计算机中通常配备了多核处理器，每个核心都可以独立地执行指令。当多个任务同时运行时，每个核心可以分配给一个任务进行处理，从而实现并行执行。这种并发性可以提高计算机系统的整体性能和吞吐量。
需要注意的是，并发性并不一定意味着真正的同时执行，它可以通过任务交替执行或者时间片轮转等方式来模拟多个任务的同时性。而同时性则强调任务之间的独立性和无关性。
综上所述，同时性和并发性是计算机系统中重要的概念。同时性强调逻辑上的任务独立性和并行性，而并发性则强调物理上的任务同时执行。它们都在不同的场景中发挥作用，帮助提高计算机系统的效率和性能。

什么是计算机流水线技术

计算机流水线技术（Computer Pipeline）是一种将计算机指令的执行过程划分为多个阶段，并使这些阶段可以并行执行的技术。通过流水线技术，计算机可以同时执行多条指令，提高了计算机的运行效率和性能。

在传统的计算机执行过程中，每条指令需要经过取指令、译码、执行、访存和写回等阶段，这些阶段是依次执行的。而在流水线技术中，计算机的执行过程被划分为多个子阶段，并且这些子阶段可以并行执行，形成一个流水线。

计算机流水线通常包括以下几个阶段：

取指令（Instruction Fetch）：从内存中获取下一条要执行的指令。
译码（Instruction Decode）：对指令进行解析和识别，确定指令的操作类型和操作数。
执行（Execution）：根据指令的操作类型进行相应的运算或操作。
访存（Memory Access）：如果指令需要访问内存，则进行内存读取或写入操作。
写回（Write Back）：将执行结果写回到寄存器或内存中。

通过流水线技术，不同指令可以在不同阶段同时执行，从而提高了计算机的吞吐量和效率。当一条指令完成一个阶段后，它就可以进入下一个阶段，而不需要等待前一条指令的全部执行完成。这样，计算机可以实现指令级并行和流水线级并行，提高了指令的执行速度。然而，流水线技术也存在一些问题，例如数据相关性、控制相关性和资源冲突等，这些问题可能导致流水线的停顿和性能下降。因此，在设计和优化流水线时，需要考虑这些问题并采取相应的解决方案，以提高流水线的效率和性能。
在这里插入图片描述

存储系统的层次结构

存储系统的层次结构是指不同层次的存储设备按照其速度、容量和成本等特性划分和组织的一种结构。存储系统的层次结构通常包括以下几个层次：

主存储器（Main Memory）：即计算机的内存，用于存储当前正在执行的程序和数据。主存储器的访问速度快，但容量较小，数据在断电后会丢失。
缓存存储器（Cache Memory）：位于CPU内部或靠近CPU的地方。缓存存储器用于存储最近访问过的指令和数据，以提高CPU对这些数据的访问速度。缓存存储器速度比主存储器快，容量比主存储器小。
辅助存储器（Secondary Storage）：包括硬盘、固态硬盘（SSD）、光盘、磁带等，用于长期存储程序、文件和数据。辅助存储器的容量大，但速度较慢。
离线存储器（Offline Storage）：常见的是磁带或光盘，用于存储备份数据和长期存档数据。离线存储器的容量大，但访问速度慢且需要手动操作。

存储系统的层次结构的设计目标是在速度、容量和成本之间进行平衡，使得计算机系统在性能和经济效益方面都能得到最优的利用。

廉价磁盘冗余阵列RAID

RAID（Redundant Array of Independent Disks）是一种通过将多个独立的物理硬盘组合成一个逻辑驱动器来提高存储系统性能和数据冗余性的技术。
RAID技术通过使用不同的数据分布和冗余方案，将多个物理硬盘组合成一个逻辑驱动器，从而提供更高的数据读取和写入性能，以及更好的数据保护和容错能力。以下是几种常见的RAID级别：

RAID0：数据条带化（striping）存储在多个硬盘上，提供了高读写性能，但没有数据冗余备份。
RAID1：镜像（mirroring）两个硬盘上的数据，提供了数据冗余备份，但读写性能与单个硬盘相当。
RAID5：将数据分块存储在多个硬盘上，并使用奇偶校验信息来提供数据冗余备份和容错能力。RAID 5至少需要3个硬盘。
RAID10（也被称为RAID 1+0）：将多个RAID 1组合在一起，实现数据冗余备份和高性能读写能力。RAID 10至少需要4个硬盘。

除了上述常见的RAID级别，还有一些其他级别（如RAID 2、RAID 3、RAID 4），它们使用不同的数据分布和冗余策略，适用于特定的应用需求。
RAID技术被广泛应用于服务器、存储系统和数据中心等需要高性能和可靠性的环境，它提供了一种经济高效的解决方案来提高存储系统的性能和数据可靠性。

为什么cpu的时钟频率不能无限制增加

CPU的时钟频率不能无限制增加主要受到以下几个因素的限制：

功耗和热量：随着时钟频率的增加，CPU的功耗和热量也会增加。较高的时钟频率需要更多的电力供应，产生更多的热量。如果超过CPU和散热系统的设计限制，可能导致温度过高，影响CPU的性能和寿命，甚至引发故障。
物理限制：在制造过程中，CPU内部的晶体管被设计为特定尺寸和结构，超过设计频率可能导致电子流动速度和响应时间的限制，影响CPU的工作正常性。
电场效应和信号传输延迟：高频率时钟使得电子在内部结构中的移动速度更快，可能导致电场效应和信号传输延迟的问题。这可能导致信号互相干扰，影响计算机的正确运行。
软件兼容性：在一定频率范围内，主板和其他硬件设备必须与CPU的时钟频率保持同步。如果时钟频率超过了其他硬件的兼容性范围，可能导致系统不稳定或无法正常工作。

综上所述，为了平衡功耗、散热、物理限制、信号传输延迟和软件兼容性等因素，CPU的时钟频率有一个最大限制，不可无限制增加。因此，CPU制造商在设计和生产过程中会根据这些因素的考虑确定最适合的时钟频率范围。

不想再抄代码的打工人

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
计算机系统系统结构----基本概念(笔记)

翻译通常指的是将一种高级编程语言（如C、Java等）的代码转换成机器可以执行的低级指令或二进制代码的过程。翻译的结果是生成一个独立的可执行文件，它可以在不同的计算机上运行。所以根据此容易得出答案，在假设的条件下，CPUb虽然执行的指令条数较少，但CPUa的时钟周期更短，所以CPUa快，而改变条件为1.1倍的条件下，CPUb比CPUa运行更快。一般来说，解释执行比编译后再执行所花的时间多，但占用的存储空间较少。在下述的6级层次结构中，通常L0-L2是用解释的方法实现，而L3-L5是用翻译的方法实现。
复制链接

扫一扫