操作系统是管理和控制计算机硬件和软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件。注意,这里说的裸机可以是物理机,也可以是虚拟机。随着技术的发展,现在还出现了Docker容器技术,一个Docker容器实际上不一定需要具备完整的系统功能也能够运行程序,其底层是通过宿主机的内核来与硬件进行交互的。
处理机与进程管理
处理机(CPU)是计算机的核心资源,进程是在处理机上运行的最小独立单位。从进程的观点来看操作系统,实际上就是组织和协调用户对处理机的争夺使用,对进程进行管理和控制,最大限度发挥处理机的作用。
1.进程的概念。
程序是存储在计算机上的代码,进程是运行状态的程序。进程发展经历了顺序程序和多道(并发)程序。
顺序程序执行的特征:
- 顺序性:每一操作必须在下一操作开始之前结束
- 封闭性:程序运行时独占全机资源,资源的状态(除初始状态外)只有本程序才能改变,程序一旦执行,其结果不受外界影响
- 可再现性:程序执行环境和初始条件相同,重复执行时,结果相同
多道程序执行的特征:
- 间断性:程序并发运行时,共享系统资源,为完成同一任务相互合作,会形成相互制约关系,导致并发程序具有“执行-暂停-执行”这种间断性的活动规律
- 失去封闭性:程序并发执行时,资源状态由多个程序改变,某程序执行时,会受到其他程序影响,失去封闭性
- 不可再现性:失去封闭性,导致失去可再现性
进程的特征:
- 结构特征:程序段、相关数据段和PCB三部分构成进程实体
- 动态性:进程实体的一次执行过程,具有生命期,而程序是有序指令集合,是静态的
- 并发性:多个进程同时存于内存,在一段时间内同时运行
- 独立性:进程实体是一个能独立运行、独立分配资源和独立接受调度的基本单位
- 异步性:进程按各自独立的、不可预知的速度向前推进
2.进程状态
三态模型
五态模型
3.进程控制块
进程实体由程序块、进程控制块(Process Control Block,PCB)和数据块三部分组成。
程序块描述进程要完成的任务,数据块包括程序执行时所需要的数据和工作区,PCB包括进程的描述信息、控制信息、资源信息和CPU现场保护信息等,反映了进程的动态性。
PCB 可以被操作系统中的多个模块读或修改,如被调度程序、资源分配 程序、中断处理程序以及监督和分析程序等读或修改。OS是根据 PCB来对 并发执行的进程进行控制和管理,是操作系统中最重要的记录型数据,Linux 系统中用 task_struct 数据,Windows系统使用执行体进程块(EPROCESS)。
- 进程标识符:包括内部标识符,操作系统为每一个进程赋予的唯一数字标识符,系统使用;外部标识符,由创建者提供,通常有字母与数字组成,往往是由用户(进程)在访问该进程时使用。描述进程的家族关系,设置父进程标识
及子进程标识,还可设置用户标识,以指示拥有该进程的用户。 - 处理机状态(处理机状态信息):主要是由处理机的各种寄存器中的内容组成的,处理机被中断时,所有这些信息都必须保存在PCB中,以便在该进程重新执行时,能从断点继续执行。寄存器包括:通用寄存器、指令计数器、程序状态字PSW、用户栈指针。
- 进程调度信息:与进程调度和转换相关的信息包括:进程状态、进程优先级、进程调度所需的其它信息(与进程调度算法有关)、事件,指进程由执行状态转变为阻塞状态所等待发生的事件,即阻塞原因。
- 进程控制信息:包括程序和数据的地址、进程同步和通信机制、资源清单:除CPU以外的、进程所需的全部资源及已经分配到该进程的资源、链接指针:了本进程(PCB)所在队列中 的下一个进程的 PCB的首地址。
4.进程控制
进程控制的主要任务就是系统使用一些具有特定功能的程序端来创建、撤销进程以及完成进程各状态之间的转换,从而达到多进程、高效率、并发的执行和协调,实现资源共享的目的。
进程控制主要通过操作原语实现,用于控制的原语包括:创建原语、阻塞原语、撤销原语、唤醒原语、优先级原语和调度原语。
5.进程互斥与同步
这一部分几乎每年必考
系统中某些资源可以供多个进程同时使用(如共享内存),有些资源则只允许一次被一个进程使用(如打印机),一次仅允许一个进程使用的资源称为临界资源(Critical Resource)。
进程互斥(Mutual Exclusion)就是指若干进程因相互抢夺独占型资源而产生的竞争制约关系。
进程同步(Synchronization)就是指为完成共同任务的并发进程基于某个条件来协调其活动,因为需要在某些位置上排定执行的先后次序而等待、传递信息或消息所产生的协作制约关系。
对于临界资源(Critical Resource)的管理有四条原则:1、有空即进;2、无空则等;3、有限等待;4、让权等待。
信号量可以有效的实现进程的同步与互斥
信号量(semaphore)的数据结构为一个值和一个指针,指针指向等待该信号量的下一个进程。信号量的值与相应资源的使用情况有关。当它的值大于0时,表示当前可用资源的数量;当它的值小于0时,其绝对值表示等待使用该资源的进程个数。注意,信号量的值仅能由PV操作来改变。
一般来说,信号量S >= 0时,S表示可用资源的数量。执行一次P操作意味着请求分配一个单位资源,因此S的值减1;当S < 0时,表示已经没有可用资源,请求者必须等待别的进程释放该类资源,它才能运行下去。而执行一个V操作意味着释放一个单位资源,因此S的值加1;若S <= 0,表示有某些进程正在等待该资源,因此要唤醒一个等待状态的进程,使之运行下去。
6.进程间通信与管理
进程间通信可以分为控制信息传递和大量数据传递。大量数据传递又叫做高级通信,分为有缓冲区的通信和无缓冲区的通信。
管程(monitor):代表共享资源的数据结构及并发进程在其上执行的一组进程就构成管程,管程被请求和释放资源的进程锁调用。
7.进程调度与死锁
进程调度即处理器调度,又叫做上下文切换。可以通过下面的思维导图了解。
死锁是两个以上的进程互相要求对方已经占有的资源导致无法继续运行下去的现象。产生死锁的原因是:1、因为系统资源不足;2、进程运行推进的顺序不合适;3、资源分配不当等。
8.线程
进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的一个独立单位。
线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。也有就绪、运行、阻塞三态。
参考资料:
1、操作系统原理总结
2、操作系统基本原理
3、操作系统基础知识整理
4、进程控制块及其作用、组织方式
5、进程控制
6、操作系统:管程理解