计算机系统 笔记(1)系统漫游

  • 系统基本思想:

系统中的所有信息----包括磁盘文件,存储器中的程序以及网络上传送的数据,都是由一串位表示的。

区分不同数据对象的唯一方法是读到这些数据对象的上下文。

  • C语言起源
1969 ~ 1973年创建,用于Unix系统的程序设计语言。
大部分Unix内核,以及所有支撑工具和函数库都是用C语言编写的,所以,C语言是系统级编程的首选。

  • 源程序到可执行文件
为了在系统上运行源程序,需要被转化成一系列低级机器语言指令,然后这些指令按照一种称为“可执行目标程序”的格式打好包,并以二进制磁盘文件的形式存储起来,目标程序也称为可执行目标文件。这是编译系统干的活。
  • 编译系统:
由预处理器、编译器、汇编器、链接器四部分组成,对应以下四个阶段:
  1. 预处理阶段: 输出格式-->文本格式。处理#开头的命令,例如#include X.h,会把文件都插入源程序文本中。
  2. 编译阶段: 输出格式-->文本格式。加入汇编语言程序。
  3. 汇编阶段: 输出格式-->二进制格式。翻译成机器语言指令,把这些指令打包成“可重定位目标程序”的格式。
  4. 链接阶段: 输出格式-->二进制格式。合并程序中调用的库函数,这些库函数已经经过了前三个阶段。合并结束得到一个可执行目标文件。
了解编译系统有什么用?
优化程序性能(哪个语句更高效?if&switch,while&for...);理解链接时出现的错误;避免安全漏洞(缓冲区溢出)。

下面就是要执行这个程序,有必要先了解一下运行这个程序的硬件组成:
  • 系统硬件组成
(1)总线:为什么首先介绍总线呢,因为我们系统能支持多少位,跟总线的关系非常密切。系统是32&64?不是把一个64bit的CUP拆下来塞到一个32bit的机器上就能工作的,总线不达标,是没法工作的。总线分系统总线和I/O总线,是一组贯穿整个系统的电子管道。通常总线被设计成传送定长的字节快,也就是字。这个字就是一个基本系统参数了,4个字节的就是32bit系统,8个字节的就是64bit系统。
(2)I/O设备:管输入输出的,如鼠标键盘显示器硬盘显卡网络适配器等。每个I/O设备都通过一个控制器或适配器与I/O总线相连,控制器是置于I/O设备本身的或者主板上的芯片组;适配器是插在主板插槽上的卡。它们只是封装方式不同,完成的功能都是在I/O设备和I/O总线之间传递信息。
(3)主存:RAM。从物理上来说,主存是由一组动态随机存取存储器(DRAM)芯片组成的;从逻辑上来说,存储器是一个线性的字节数组,每个字节都有其唯一的地址,这些地址是从零开始的。
(4)处理器:CPU。是解释或者执行存储在主存中指令的引擎。核心是一个字长的寄存器,称为程序计数器(PC)。在任何时刻,PC都指向主存中的某条机器语言指令(即含有该条指令的地址)。这里就能解释一个重要概念了:虚拟内存。虚拟内存到底能有多大,要看PC的数值能有多大,这里PC只能存一个字长,那么虚拟内存只能是一个字长的数据能覆盖到的地址空间,所以64bit的机器可扩展的虚拟内存会远远大于32bit的机器。处理器操作是围绕着主存、寄存器文件和算术逻辑单元(ALU)进行的。寄存器文件是一个小的存储设备,由一些1字节长的寄存器组成,每个寄存器都有唯一的名字。
  • 程序执行过程
当程序加载时,可执行文件被从磁盘复制到内存,当处理器执行时,指令从主存复制到处理器,处理结果再复制到显示器,即系统花费了大量时间把信息从一个地方挪到另一个地方。根据机械原理,较大的存储设备要比较小的存储设备运行的慢,例如,一个磁盘可能比主存大1000倍,但是处理器从磁盘驱动器上读取一个字的时间开销要比从主存中读取的开销大1000万倍。同样的,寄存器和主存也此道理。为了加快处理器和主存之间的差距,高速缓存应运而生。
  • 高速缓存
针对处理器和主存之间的差异,CPU芯片增加了寄存器文件和主存之间的中间存储器,存放一些可能用到的信息。现在按从小到大一般有三级缓存L1、L2、L3。高速缓存是用一种叫做静态随机访问存储器(SRAM)的硬件技术实现的。通过在高速缓存里存放可能经常访问的数据的方法,大部分的存储操作都能在快速的高速缓存中完成。意识到高速缓存存在的应用程序员可以利用高速缓存将他们的程序性能提高一个数量级。
  • 操作系统管理结构
操作系统两个基本功能:
(1)防止硬件被失控的应用程序滥用。
(2)向应用程序提供简单一致的机制来控制复杂而又通常大相径庭的低级硬件设备。
通过进程、虚拟存储器、文件来实现这个两个基本功能。文件是对I/O设备的抽象,例如键盘显示器;虚拟存储器是对主存和磁盘I/O设备的抽象;进程则是对处理器、主存、I/O设备的抽象。
  • 进程
进程是操作系统对正在运行的程序的一种抽象。进程间切换又称为上下文切换,上下文指操作系统保持跟踪进程运行所需的所有状态信息。

  • 线程
每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。
  • 虚拟存储器
虚拟存储器是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独立的使用主存。每个进程看到的是一致的存储器,其实这些地址空间是虚拟的,基本思想是把一个进程虚拟存储器的内容存储到磁盘上,然后用主存作为磁盘的高速缓存。
虚拟地址空间的各个区(由低地址到高地址):
(1)程序代码和数据区:是由可执行目标文件的内容初始化的,包括只读(大部分是只读属性)的代码和全局变量。代码一开始运行就固定了大小。
(2)堆区:紧接着上一个区。堆区大小动态改变。
(3)共享库区:中间部分存放C标准库和数学库这样共享库的代码和全局数据。
(4)栈区:位于用户虚拟地址空间的顶部,编译器用它来实现函数调用。
(5)内核虚拟存储器:这部分存储器对用户代码不可见。这部分区域是为操作系统内核保留的,此空间地址空间比栈区要高。
  • 文件
文件就是字节序列。
每个I/O设备(网络也是),都可以视为文件。系统中的所有输入输出都是通过使用一小组称为 Unix I/O 的系统函数调用读写文件来实现的。
  • 并发
(1)线程级并发
Intel Core i7 是一款四核处理器,却可以同时执行8个线程,这要归功于超线程技术。超线程,允许一个CPU执行多个控制流,因为它的某些CPU硬件有多个备份,比如程序计数器和寄存器文件。常规处理器大约需要20000个时钟周期切换线程,而超线程处理器可以在单个周期的基础上决定要执行哪一个线程。
(2)指令级并行
在较低的抽象层次上,现代处理器可以同时执行多条指令的属性称为指令级并行。如果处理器可以达到比一个周期一条指令更快的执行效率,就称为超标量。
(3)单指令、多数据并行
在最低层次上,许多现代处理器拥有特殊的硬件,允许一条指令产生多个可以并行执行的操作,这种方式称为单指令、多数据,即SIMD并行。
  • 抽象
(1)文件是对I/O的抽象。
(2)虚拟存储器是对程序存储器的抽象。
(3)进程是对一个正在运行的程序的抽象。
(4)虚拟机是对整个计算机(包括操作系统、处理器和程序)的抽象。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值