一、进程的定义
我们先来看看程序是什么: 程序就是一个指令序列。
1.1 单道程序技术
在早期的计算机中只支持单道程序,来用一张图看看支持单道程序的计算机:
在内存中,将程序段放在内存低位,数据段放在内存高位。在计算机执行程序时,只需要去内存低位依次执行指令就好了。
1.2 多道程序技术
但是时代总是在进步的,单道程序已经无法满足人们对计算机处理速度的需求,就出现了多道程序技术。为了方便操作系统管理多道程序,完成个程序并发执行,引入了进程、进程实体的概念。内存中同时存放多道程序,各个程序的代码、运算数据存放的位置不同。操作系统要怎样才能找到各个程序的存放位置呢?
从图上发现,除了多道程序段和数据段之外,还出现了一个叫PCB1的东西,这就是系统为每个运行的程序配置一个数据结构,称为程序控制块,用来描述进程的 各种信息(如程序代码存放的位置)。
而PCB、程序段、数据段三部分就构成了我们之前提到的进程实体(进程映像)。
一般情况下,我们把进程实体简称为进程。所谓的创建进程,实际上时创建进程试题中的PCB;而撤销进程,实质上时撤销进程实体中的PCB。
注意:PCB时进程存在的唯一标志。
那么接下来我们就来看看进程的定义——从不同的角度,进程可以有不同的定义,比较传统的有:
- 进程是程序的一次执行过程
- 进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
- 进程是具有单独功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。
这三个方面都强调了进程的“动态性”。
引入进程实体的概念后,就可以把进程定义为:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注意:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非专门研究而这区别,否则可以认为进程实体就是进程。因此我们可以说“进程由程序段、数据段、PCB三部分组成”。
二、进程的组成
将内存分出三块区域:
- 程序段:存放程序代码。
- 数据段:是程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量就存放在数据段中。
- PCB:操作系统通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需要的各种信息。
大家有可能是第一次接触PCB,那么就来具体认识以下吧,这里列举了一些该概念的具体描述。
-
进程标识符PID:当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的ID,用于区分不同的进程(类似于身份证号)。
-
用户标识符UID:为了表示用户的ID,让计算机知道进程所属的用户是谁。
-
寄存器值:当进程切换时需要把进程当前的运行情况记录下来保存在PCB中,如程序计数器的值表示了当前程序执行到哪一句。简单来说,就是一些程序来执行的过程中会计算出一些结果(这时进程并没有执行完毕),而当进程需要切换时,可以将这些值保存起来供下一次使用。
其实,大家只要记住PCB是存储管理进程的信息,数据段和程序段是存储运算本身需要的信息。
三、进程的组织方式
在一个系统中,通常由数十、数百乃至数千个PCB。为了能对它们加以有效的管理,应该用适当的方式把这些PCB组织起来。
进程的组成讨论的是一个进程内部由那些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题。
3.1 链接方式
- 按照进程状态将PCB分为多个队列
- 操作系统持有指向各个队列的指针
3.2 索引方式
- 根据进程状态的不同,建立几张索引表
- 操作系统持有指向各个索引表的指针
四、进程的特征
进程和程序是两个截然不同的概念,相比于程序,进程拥有以下特征:
- 动态性:进程是程序的一次执行过程,是动态地产生、变化和消亡的。
- 并发性:内存中由多个进程运行,各程序可并发执行。
- 独立性:进程是能够独立运行、独立获得资源、独立接受调度的基本单位。
- 异步性:各进程按格子独立的、不可预知的的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题.
- 结构性:每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。
五、进程的状态与转换
5.1 进程的状态
进程是程序的一次执行。在这个执行过程,有时进程正在被CPU处理,有时又需要等待CPU服务。可见,进程的状态会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。
进程的三种基本状态:
- 运行态:在单核处理机环境下,每一时刻最多只有一个进程处于运行态。(双核环境下可以同时有两个进程处于运行态)
- 就绪态:进程已经拥有了除处理机之外所有需要的资源,一旦获得处理机,即可立即进入运行态开始运行。即:万事俱备,只欠CPU
- 阻塞态:因某一事件暂时不能运行。如:等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部分,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU的服务。
除了三种基本状态,CPU还有另外两种是在进程的创建和终止时刻出现的。
- 创建态:操作系统需要完成创建进程。操作系统为该进程分配所需的内存空间等系统资源,并为其创建、初始化PCB(如:为进程分配PID)
- 终止态:进程运行结束(或者由于bug导致进程无法继续执行下去,比如数组越界错误),需要撤销进程。操作胸痛需要完成撤销相关的工作。完成将分配给进程的资源回收,撤销进程PCB等工作。
5.2 进程状态的转换
了解了进程的五种状态,那么它们又是在什么情况下进行转换的呢?
- 运行态—>阻塞态 是一种进程自身做出的主动行为。
- 阻塞态—>就绪态 是不受进程自身能控制的,是一种被动行为。
注意:不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出着中国请求)。
六、进程控制
6.1 什么是进程控制?
进程控制的主要功能是对系统中所有进程实施有效的管理,它具有创新进程、撤销已有进程、实现进程状态转换等功能。
其实简单来说,就是要实现进程状态的转换。
6.2 如何实现控制进程?
- 首先创建进程时,需要初始化PCB、分配系统资源
- 创建态—>就绪态:需要修改PCB内容和相应的队列
- 就绪态—>运行态:需要恢复进程运行环境、修改PCB内容和相应队列
- 运行态—>就绪态:需要保存运行境、修改PCB内容和相应队列
- 运行态—>阻塞态:需要保存运行境、修改PCB内容和相应队列
- 阻塞态—>就绪态:需要修改PCB内容和相应的队列。如果等待的是资源,则还需要为进程分配系统资源。
- 运行态—>终止态:需要回收进程拥有的资源,撤销PCB
因为进程在转换状态时不应受到中断,所以要用原语来实现进程控制。
原语的特点时执行期间不允许中断,只能一气呵成。这种不可被中断的操作就是原子操作。
原语采用“关中断指令”和“开中断指令”实现
显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令。
6.3进程控制相关的原语
无论哪个原语,要做的无非三类事情:
- 更新PCB中的信息
a.所有的进程控制原语一定都会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行状态
c.某进程开始运行前必然要恢复运行环境 - 将PCB插入合适的队列
- 分配/回收资源
原语的类型
(1)进程的阻塞和唤醒
(2)进程的切换
(3)进程的创建
(4)进程的终止
七、进程通信
7.1 什么是进程通信?
顾名思义,就是指进程之间的信息交换。
进程是分配系统资源的单位,因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。
7.1 共享方式
两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。操作系统只负责提供共享空间和同步互斥工具(如P、V操作)。
而共享方式又分为两种:
- 基于数据结构的共享:比如共享空间里只能方一个长度为10的数组。这种共享方式速度慢、限制多,是一种弟级通信方式。
- 基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
7.2 管道通信
“管道”是指用于连续读写进程的一个共享文件,又名pipe文件。其实就是在内存区中开辟一个大小固定的缓冲区。
- 管道只能爱用半双工通信,某一时间段内只能实现单向的传输。如果要想试下双向同时通信,则需要设置两个管道。
- 各进程要互斥地访问管道。
- 数据以字符流地形式写入管道,当管道写满时,写进程write()系统调用将被阻塞,等待都进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程地read()胸痛调用将被阻塞。
- 如果没写满,就不允许读。如果没读空,就不允许写。
- 数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会又读错数据的情况。
7.3 消息传递
进程间的数据交换以格式化的消息为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
而消息传递又分为两种方式:
- 直接通信方式:消息直接挂到接受进程的消息缓冲队列上
- 简洁通信方式:消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。