计算机系统概论第1、2章笔记-CSDN博客

本文链接：https://blog.csdn.net/ajole/article/details/139972246

第1，2章

1. 从问题描述到电子运转

用计算机来解决问题，总的来说分为如下几个层次

问题——算法——语言——机器(ISA)结构——微结构——电路——器件

1.1 问题

描述问题的时候，我们最常用的就是自然语言，人们可以很容易的知道其中的意思，但计算机就未必，因为自然语言包含太多的二义性(对于计算机来说这会让它茫然不知所措)

1.2 算法

从问题的提出开始，向下转换的第一步就是将问题的自然语言描述转换为算法描述。算法描述有如下特点：

确定性
可计算性
有限性

1.3 程序语言

下一步将算法转换为程序，即用编程语言描述。编程语言属于“机械语言”，与自然语言不同，被设计成严格的顺序方式，以便让计算机顺序的执行指令序列(即不存在二义性问题)

计算机语言分为高级语言和低级语言两类，前者包括C/C++，java，python等，后者则包括各种汇编语言，通常一种低级语言只对应一种计算机，我们称之为“某某机器的汇编语言”

1.4 机器结构(指令集结构)

再下一步就是将程序转换成特定计算机的指令集，指令集结构(Instruction Set Architecture, ISA)是程序和计算机硬件之间接口的一个完整定义。

ISA定义的内容包括：

计算机可以执行的指令集合，即计算机所能执行的操作，以及每个操作所需数据是什么，即操作数
可接受的操作数表达方式，即数据类型
获取操作数的机制，定位各种操作数的不同方法，即寻址模式

或者换一种理解方式：指令集相当于对一段固定宽度的01序列规定了识别的规则

比如：对于一个16位的二进制序列，我们可以规定前4位是操作码，从0000到1111可以规定16种不同的操作，同时我们规定其中的0001是ADD操作(加法)，然后可以再规定第5位到第10位(包括5和10)是第一个操作数，第11位到第16位(包括11和16)是第二个操作数

那么对于一个16位的二进制序列如0001000100000010，就可以解读如下

0001(表示ADD)000100(即4)000010(即2)——即4+2

当然，如上的例子中并没有标识数据类型，寻址模式等，仅仅只是以简单的方式帮助理解指令集的概念而已

不用的ISA定义的操作类型，数据类型和寻址模式的数目都是不同的，设计时还需要考虑计算机内存的大小及每个存储单元的宽度(即能容纳的0和1的数目)

许多ISA一直延续至今，典型的例子就是x86

将高级语言(如C语言)翻译为ISA指令(如x86)的过程，通常是由一个被称为“编译器”的程序来实现的。例如，将C语言翻译成x86 ISA时，需要一个“x86的C编译器”，就是说，针对不同的高级语言和目标计算机组合，需要一个对应的编译器

而将特定计算机的汇编语言程序翻译为其ISA的过程，则是由汇编器来完成的

需要注意的是，汇编语言并不能和指令集等同

指令集是硬件层面的抽象概念，描述了处理器能执行的基本操作。它是对计算机硬件的抽象，是处理器架构的一部分。
汇编语言则是一种低级编程语言，用来代表和操作指令集。它为程序员提供了与处理器指令集更直接的接口，比机器语言更容易理解和编写。
每种处理器架构都有自己的指令集，如x86、ARM、MIPS等。而针对不同的指令集，都会有对应的汇编语言。

换句话说，前文的加法指令，我们可以直接用ADD来代表0001，用4来代表000100，用2来代表000010

那么这句话就可以写成ADD 4 2

用相对易于解读的语言来描述二进制序列，这就是汇编语言

而对于不同的指令集来说，由于制定的规则不同，那么想用汇编语言去描述二进制序列也就不一样，这就是针对不同的指令集，都会有对应的汇编语言的原因

相应的，基于指令集的规则，每一条汇编语言的指令都可以直接转换为二进制序列，供计算机识别解读

从某种意义上说，01序列是最靠近底层(即计算机)的语言(让我们姑且这样说)，汇编语言则是初步向着便于人类理解的方向靠近了一步，尽管被称为低级语言，但这也是和高级语言相对应的，高级语言则比汇编更靠近了人类一步