操作系统第2章（进程管理）

清风微浪又何妨

已于 2023-08-11 21:38:10 修改

阅读量317

点赞数 2

分类专栏：操作系统文章标签：系统架构考研面试

于 2023-08-08 23:16:10 首次发布

本文链接：https://blog.csdn.net/qq_61906328/article/details/132176268

版权

操作系统专栏收录该内容

22 篇文章 0 订阅

订阅专栏

1.进程的定义，组成，组织方式，特征

1.进程

程序：就是指令序列

引入多道程序（CPU可以并发执行多个程序）之后，为了方便操作系统进行管理，引入了进程，进程实体的概念。

PCB（进程控制块，是给OS用的），程序段，数据段（这后两个是给进程自己用的）三部分构成了进程实体（也叫作进程映像）。一般情况下，我们把进程实体简称为进程。
进程是动态的，进程实体（进程映像）是静态的。
进程实体反应了进程在某一时刻的状态。
进程是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

例如，所谓创建进程，实质上是创建进程实体中的PCB;而撤销进程，实质上是撤销进程实体中的PCB.

PCB是进程存在的唯一标识。

2.进程的组织方式

在一个系统中，通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理，应该用适当的方式把这些PCB组织起来。
注: 进程的组成讨论的是一个进程内部由哪些部分构成的问题，而进程的组织讨论的是多个进程之间的组织方式问题。

相当于java中的链表和数组。

3.进程的特征

2.进程的状态和转换

1.状态

进程是程序的一次执行。在这个过程中，进程的状态会有各种变化。为了方便各个进程的管理，操作系统将进程划分为几个状态。
进程PCB中，会有一个变量 state 来表示进程的当前状态，为了对同一状态下的各个进程统一管理，OS会将各个进程的PCB组织起来。

除此之外，进程还有两种状态。

2.转换

3.进程控制

含义

进程控制就是要实现进程状态转换。

实现

进程控制由原语实现。所谓原语，一般是指由若干条指令组成的程序段，用来实现某个特定功能，在执行过程中不可被中断（原子性）。

原语采用 “关中断指令” 和 “开中断指令” 来实现。注意：原语运行在核心态。

进程控制相关原语

在这里插入图片描述

无论哪个进程控制原语，要做的无非三类事情：

更新PCB中的信息（如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
a.所有的进程控制原语一定都会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境
c.某进程开始运行前必然要恢复其运行环境
将PCB插入合适的队列
分配/回收资源

具体实现如图所示：

4.进程通信

含义

进程通信就是进程之间的信息交换。

为了保证安全，一个进程不能直接访问另一个进程的地址空间。

操作系统提供了三种方法：共享存储，消息传递，管道通信。

1.共享存储

设置一个共享内存区域，并映射到进程的虚拟地址空间
要互斥地访问共享空间（由通信进程自己负责实现互斥）

2.管道通信

设置一个特殊的共享文件（管道），其实就是一个内存缓冲区（临界资源需要互斥访问）

1.管道只能采用半双工通信，某一时间段内只能实现单向的传输。如果要实现双向同时通信，则需要设置两个管道。
2.各进程要互斥地访问管道。
3.数据以字符流的形式写入管道，当管道写满时，写进程的write()系统调用将被阻塞，等待读进程将数据取走。当读进程将数据全部取后，管道变空，此时读进程的read()系统调用将被阻塞。
4.写进程往管道写数据，即便管道没被写满，只要管道没空，读进程就可以从管道读数据；读进程从管道读数据，即便管道没被读空，只要管道没满，写进程就可以往管道写数据。（原版有变化已修正）
5．数据一旦被读出，就从管道中被抛弃，这就意味着读进程最多只能有一个，否则可能会有读错数据的情况。对此有两种解决方案：(1)一个管道允许多个写进程，一个读进程 (2)允许多个写进程，多个读进程

3.消息传递

进程间的数据交换以格式化的消息为单位。进程通过操作系统提供的“发送消息/接收消息” 两个原语进行数据交换。

类似于Http协议。

间接通信方式，可以多个进程往同一个信箱send消息，也可以多个进程从同一个信箱receive消息。

5.线程概念和多线程模型

1.概念

有的进程需要同时做很多事，例如用QQ来进行聊天，发送文件等，而传统的进程只能串行执行一系列程序。因此，引入“线程”，来增加并发度。

可以把线程理解为轻量级的进程。
传统的进程是程序执行流的最小单位，引入线程后，线程是一个基本的CPU执行单元，也是如今程序执行流的最小单位。
引入线程后，进程只作为除CPU之外的系统资源的分配单元（传统进程机制中，进程是资源分配、调度的基本单位；引入线程后，进程是资源分配的基本单位，线程是调度的基本单位）。
线程间并发，如果是同一进程内的线程切换，则不需要切换进程环境，系统开销小。（但需要注意，内核级线程的线程切换由操作系统内核完成，需要切换到核心态，也是需要成本开销的。）

在这里插入图片描述

2.线程分类

用户级线程

用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责（包括线程切换)
用户级线程中，线程切换可以在用户态下即可完成，无需操作系统干预。
在用户看来，是有多个线程。但是在操作系统内核看来，并意识不到线程的存在。（用户级线程对用户不透明，对操作系统透明)
可以这样理解，“用户级线程”就是“从用户视角看能看到的线程”。

内核级线程

内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责，因此内核级线程的切换必然需要在核心态下才能完成。
可以这样理解，“内核级线程”就是“从操作系统内核视角看能看到的线程”。

操作系统只“看得见”内核级线程，因此只有内核级线程才是处理机分配的单位。
在这里插入图片描述
注意：上图是以多线程模型中的一对一模型为例，重点关注其中的“内核级线程”即可。

6.多线程模型

多对一模型

多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高
缺点:当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可在多核处理机上并行运行

一对一模型

一对一模型:一个用户级线程映射到一个内核级线程。
优点:当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

多对多模型

多对多模型:n用户级线程映射到m个内核级线程(n >=m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点，又克服了一对一模型中一个用户进程占用太多内核级线程，开销太大的缺点。

在这里插入图片描述

7.处理机调度的概念和层次

含义

在多道程序系统中，进程的数量往往是多于处理机的个数的，这样不可能同时并行地处理各个进程。

处理机调度，就是从就绪队列中按照一定的算法选择一个进程并将处理机分配给它运行，以实现进程的并发执行。

调度分为三个层次，分别为高级调度，中级调度，初级调度。

不支持内核级线程的OS，调度程序的处理对象是进程；支持内核级线程的OS，调度程序的处理对象是内核线程，此时进程只是资源分配的基本单位

1.高级调度

由于内存空间有限，有时无法将用户提交的作业全部放入内存，因此就需要确定某种规则来决定将作业调入内存的顺序。
高级调度（作业调度)。按一定的原则从外存上处于后备队列的作业中挑选一个(或多个）作业，给他们分配内存等必要资源，并建立相应的进程（建立PCB)，以使它（们）获得竞争处理机的权利。
高级调度是辅存（外存）与内存之间的调度。每个作业只调入一次，调出一次。作业调入时会建立相应的PCB，作业调出时才撤销PCB。高级调度主要是指调入的问题，因为只有调入的时机需要操作系统来确定，调出的时机必然是作业运行结束才调出。

2.中级调度

引入了虚拟存储技术之后，可将暂时不能运行的进程调至外存等待。等它重新具备了运行条件且内存又稍有空闲时，再重新调入内存。这么做的目的是为了提高内存利用率和系统吞吐量。
暂时调到外存等待的进程状态为挂起状态。值得注意的是，PCB并不会一起调到外存，而是会常驻内存。PCB中会记录进程数据在外存中的存放位置，进程状态等信息，操作系统通过内存中的PCB来保持对各个进程的监控、管理。被挂起的进程PCB会被放到挂起队列中。
中级调度（内存调度），就是要决定将哪个处于挂起状态的进程重新调入内存。
一个进程可能会被多次调出、调入内存，因此中级调度发生的频率要比高级调度更高。

补充知识：进程的七状态模型

暂时被调到外存等待的进程状态称为挂起状态。
挂起状态又可以进一步细分为就绪挂起，堵塞挂起两种状态。
之所以会有“挂起”状态，是因为内存不空闲，为了减轻系统负载，提高资源利用率。

3.低级调度

低级调度（进程调度），其主要任务是按照某种方法和策略从就绪队列中选取一个进程，将处理机分配给它。
进程调度是操作系统中最基本的一种调度，在一般的操作系统中都必须配置进程调度。
进程调度的频率很高，一般几十毫秒一次。

4.三种调度的联系和对比

8.进程调度的时机，切换过程和方式

1.进程调度的时机

补充：
在这里插入图片描述

临界资源：一个时间段内只允许一个进程使用的资源。各进程需要互斥的访问临界资源。

临界区：访问临界资源的那段代码。

内核程序临界区一般是用来访问某种内核数据结构的，比如进程的就绪队列。

2.进程调度的方式

非剥夺调度方式，又称非抢占方式。即，只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达，当前进程依然会继续使用处理机，直到该进程终止或主动要求进入阻塞态。

优点

实现简单,系统开销小但是无法及时处理紧急任务，适合于早期的批处理系统

剥夺调度方式，又称抢占方式。当一个进程正在处理机上执行时，如果有一个更重要或更紧迫的进程需要使用处理机，则立即暂停正在执行的进程，将处理机分配给更重要紧迫的那个进程。

优点

可以优先处理更紧急的进程，也可实现让各进程按时间片轮流执行的功能（通过时钟中断）。适合于分时操作系统、实时操作系统

3.进程的切换与过程

“狭义的进程调度”与“进程切换”的区别:

狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程，也可能是另一个进程，后一种情况就需要进程切换）
进程切换是指一个进程让出处理机，由另一个进程占用处理机的过程。

广义的进程调度包含了选择一个进程和进程切换两个步骤。

进程切换的过程主要完成了:

1.对原来运行进程各种数据的保存
2.对新的进程各种数据的恢复(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息，这些信息一般保存在进程控制块)

注意 : 进程切换是有代价的，因此如果过于频繁的进行进程调度、切换，必然会使整个系统的效率降低，使系统大部分时间都花在了进程切换上，而真正用于执行进程的时间减少。

9.调度算法的评价指标

CPU利用率： CPU"忙碌"的时间占总时间的比例。
系统吞吐量：单位时间内完成作业的数量。

周转时间：是指从作业被提交给系统开始，到作业完成为止的时间间隔。

（作业）周转时间=作业完成时的时间-作业提交时间

平均周转时间=各作业周转时间之和/作业数

由于在周转时间相同的情况下，运行时间不同的作业，给用户的感觉是不一样的，所以提出了带权周转时间的概念。

等待时间：指进程/作业处于等待处理机状态时间之和，等待时间越长，用户满意度越低。

对于进程来说，等待时间就是指进程建立后等待被服务的时间之和，在等待I/O完成的期间其实进程也是在被服务的，所以不计入等待时间。
对于作业来说，不仅要考虑建立进程后的等待时间，还要加上作业在外存后备队列中等待的时间。
在这里插入图片描述

响应时间：指从用户提交请求到首次产生响应所用的时间。

1.总结

在这里插入图片描述

10.调度算法（1）

1.先来先服务（FCFS，First Come First Serve）

在这里插入图片描述
运行时间+等待时间+I/O操作时间=周转时间

2.短作业优先（SJF，Shortest Job First）

非抢占式：
在这里插入图片描述
若当前已到达的作业/进程有多个，就选取后备队列/就绪队列中靠前的

抢占式：
在这里插入图片描述其调度时机为：(1)就绪队列改变时(2)每一个进程完成时

若限制条件为“所有进程同时可运行”或者“所有进程都几乎同时到达”，此时SJF与SRNT近乎相同。

3.高响应比优先（HRRN，Highest Response Ratio Next）

在这里插入图片描述

4.三种算法对比

注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标，但是不关心“响应时间”，也并不区分任务的紧急程度，因此对于用户来说，交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统，当然，FCFS算法也常结合其他的算法使用，在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法将在下个小节介绍…

11.调度算法（2）

1.时间片轮转调度（RR，Round-Robin）

适用于分时操作系统

如果时间片太大，使得每个进程都可以在一个时间片内就完成，则时间片轮转调度算法退化为先来先服务调度算法，并且会增大进程响应时间。因此时间片不能太大。
另一方面，进程调度、切换是有时间代价的(保存、恢复运行环境)，因此如果时间片太小，会导致进程切换过于频繁，系统会花大量的时间来处理进程切换，从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小。
一般来说，设计时间片要让切换进程的开销占比不超过1%。

时间片大小为2，情况如下：

在这里插入图片描述时间片大小为5，情况如下：

2.优先级调度算法

在这里插入图片描述

3.多级反馈队列调度算法

通过下边的例子来加深理解

4.多级队列调度算法

在这里插入图片描述

5.总结

比起早期的批处理操作系统来说，由于计算机造价大幅降低，因此之后出现的交互式操作系统（包括分时操作系统、实时操作系统等）更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此这三种算法适合用于交互式系统。(比如UNIX使用的就是多级反馈队列调度算法)

12.进程同步与进程互斥

1.进程同步

通过进程通信——管道通信的例子来了解什么是进程同步。

读进程和写进程并发地运行，由于并发必然导致异步性，因此“写数据”和“读数据”两个操作执行的先后顺序是不确定的。假设实际应用中必须按照“写数据→读数据”的顺序来执行（新版大纲管道通信的读写顺序已修正）。如何解决这种异步问题，就是“进程同步”所讨论的内容。

含义

同步亦称直接制约关系，它是指为完成某种任务而建立的两个或多个进程，这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。

2.进程互斥

我们把一个时间段内只允许一个进程使用的资源称为临界资源。
许多物理设备（比如摄像头、打印机）都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。
对临界资源的访问，必须互斥地进行。互斥，亦称间接制约关系。
进程互斥指当一个进程访问某临界资源时，另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束，释放该资源之后，另一个进程才能去访问临界资源。

对临界资源的互斥访问，可以在逻辑上分为如下四个部分:

为了实现对临界资源的互斥访问，同时保证系统整体性能，需要遵循以下原则:

空闲让进。临界区空闲时，可以允许一个请求进入临界区的进程立即进入临界区;
忙则等待。当已有进程进入临界区时，其他试图进入临界区的进程必须等待;
有限等待。对请求访问的进程，应保证能在有限时间内进入临界区（保证不会饥饿)
让权等待。当进程不能进入临界区时，应立即释放处理机，防止进程忙等待。

13.进程互斥的软件实现方法

1.单标志法

算法思想:每个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。

代码实现

解释

turn的初值为0，即刚开始只允许0号进程进入临界区。
若P1先上处理机运行，则会一直卡在⑤。直到P1的时间片用完，发生调度，切换 P0上处理机运行。代码①不会卡住P0，P0可以正常访问临界区，在 P0访问临界区期间即使切换回P1，P1依然会卡在⑤。只有P0在退出区将turn改为1后，P1才能进入临界区。
因此，该算法可以实现“同一时刻最多只允许一个进程访问临界区”

turn表示当前允许进入临界区的进程号，而只有当前允许进入临界区的进程在访问了临界区之后，才会修改turn的值。

也就是说，对于临界区的访问，一定是按P0→P1→P0→P1→…这样轮流访问。这种必须“轮流访问”带来的问题是，如果此时允许进入临界区的进程是P0，而P0一直不访问临界区，那么虽然此时临界区空闲，但是并不允许P1访问。
因此，单标志法存在的主要问题是:违背“空闲让进”原则。

2.双标志先检查法

算法思想:设置一个布尔型数组flag[]，数组中各个元素用来标记各进程想进入临界区的意愿，比如“flag[0] =ture”意味着0号进程 P0现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区，如果没有，则把自身对应的标志flag[li]设为true，之后开始访问临界区。

若按照①⑤②⑥③⑦…的顺序执行，P0和P1将会同时访问临界区。因此，双标志先检查法的主要问题是:违反“忙则等待”原则。
原因在于，进入区的“检查”和“上锁”两个处理不是一气呵成的。“检查”后，“上锁”前可能发生进程切换。

3.双标志后检查法

4.Peterson算法

算法思想:双标志后检查法中，两个进程都争着想进入临界区，但是谁也不让谁，最后谁都无法进入临界区。Gary L.Peterson想到了一种方法，如果双方都争着想进入临界区，那可以让进程尝试“孔融让梨”，主动让对方先使用临界区。

Peterson算法用软件方法解决了进程互斥问题，遵循了空闲让进、忙则等待、有限等待三个原则，但是依然未遵循让权等待的原则（等待时在while中徘徊，仍然占用处理机，不及时释放）。
Peterson算法相较于之前三种软件解决方案来说，是最好的，但依然不够好。

在这里插入图片描述

14.进程互斥的硬件实现方法

1.中断屏蔽方法

2.TestAndSet指令

3.Swap指令

逻辑上与TSL相同

4.互斥锁

在这里插入图片描述

15.信号量机制

1.什么是信号量

用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作，从而很方便的实现了进程互斥、进程同步。
信号量其实就是一个变量（可以是一个整数，也可以是更复杂的记录型变量)，可以用一个信号量来表示系统中某种资源的数量，比如:系统中只有一台打印机，就可以设置一个初值为1的信号量。
原语是一种特殊的程序段，其执行只能一气呵成，不可被中断。原语是由关中断/开中断指令实现的。
一对原语: wait(S)原语和 signal(S)原语，可以把原语理解为我们自己写的函数，函数名分别为 wait和 signal，括号里的信号量s其实就是函数调用时传入的一个参数。
wait、signal原语常简称为P、V操作（来自荷兰语proberen和 verhogen)。因此，做题的时候常把wait(S)、 signal(S)两个操作分别写为P(S)、V(S)。

2.整型信号量

用一个整数型的变量作为信号量，用来表示系统中某种资源的数量。

与普通整数变量的区别：对信号量的操作只有三种，初始化，P操作，V操作。

下面以打印机为例：

3.记录型信号量

整型信号量的缺陷是存在“忙等”问题，因此人们又提出了“记录型信号量”，即用记录型数据结构表示的信号量。

在这里插入图片描述
若考试中出现 P(S)、V(S)，除非特别说明，否则默认 S 为记录型信号量。

16.用信号量实现进程互斥，同步，前驱关系

1.信号量机制实现进程互斥

互斥问题，信号量初值为1

分析并发进程的关键活动，划定临界区（如:对临界资源打印机的访问就应放在临界区)
设置互斥信号量mutex，初值为1
在临界区之前执行P(mutex)
在临界区之后执行V(mutex)

注意：对不同的临界资源（如摄像头，打印机）需要设置不同的互斥信号量。

P、V操作必须成对出现。缺少P(mutex)就不能保证临界资源的互斥访问。缺少V(mutex)会导致资源永不被释放，等待进程永不被唤醒。

2.信号量机制实现进程同步

同步问题，信号量初值为0

进程同步：要让各并发进程按要求有序的进行。

那么如何实现呢？

分析什么地方需要实现“同步关系”，即必须保证“一前一后”执行的两个操作（或两句代码)
设置同步信号量s,初始为0
在“前操作”之后执行v(S)
在“后操作”之前执行P(S)

下面通过一个例子来解释，要求：进程2的代码4必须在进程1的代码2之后执行。

3.信号量机制实现前驱关系

进程P1中有句代码S1，P2中有句代码S2 …P… P6中有句代码S6。这些代码要求按如下前驱图所示的顺序来执行:
其实每一对前驱关系都是一个进程同步问题（需要保证一前一后的操作)，因此，
1．要为每一对前驱关系各设置一个同步变量

2．在“前操作”之后对相应的同步变量执行V操作

3.在“后操作”之前对相应的同步变量执行Р操作

在这里插入图片描述

17.生产者——消费者问题

1.问题描述

系统中有一组生产者进程和一组消费者进程，生产者进程每次生产一个产品放入缓冲区，消费者进程每次从缓冲区中取出一个产品并使用。(注:这里的“产品”理解为某种数据)

两类进程之间的顺序：同步
相同/不同类的不同编号进程（注意题干是“一组”，并且缓冲区大小不为1）：互斥

生产者、消费者共享一个初始为空、大小为n的缓冲区。
只有缓冲区没满时，生产者才能把产品放入缓冲区，否则必须等待。
只有缓冲区不空时，消费者才能从中取出产品，否则必须等待。
缓冲区是临界资源，各进程必须互斥地访问。

2.问题分析

3.如何实现

4.能够改变相邻P，V的顺序

18.多生产者——多消费者

1.问题描述

桌子上有一只盘子，每次只能向其中放入一个水果。爸爸专向盘子中放苹果，妈妈专向盘子中放橘子，儿子专等着吃盘子中的橘子，女儿专等着吃盘子中的苹果。只有盘子空时，爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时，儿子或女儿可以从盘子中取出水果。用PV操作实现上述过程。

2.如何实现

问题：可不可以不使用问题信号量？

结论:即使不设置专门的互斥变量mutex，也不会出现多个进程同时访问盘子的现象

原因在于:本题中的缓冲区大小为1，在任何时刻，apple、orange、plate三个同步信号量中最多只有一个是1。因此在任何时刻,最多只有一个进程的P操作不会被阻塞，并顺利地进入临界区…

如果盘子（缓冲区）数量为2，可能会出现两个进程同时访问缓冲区的情况，有可能导致两个进程写入缓冲区的数据相互覆盖的情况。

3.总结

在生产者-消费者问题中，如果缓冲区大小为1，那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然，这不是绝对的，要具体问题具体分析。
建议:在考试中如果来不及仔细分析，可以加上互斥信号量，保证各进程一定会互斥地访问缓冲区。但需要注意的是，实现互斥的P操作一定要在实现同步的P操作之后，否则可能引起“死锁”。

19.吸烟者问题

1.问题描述

假设一个系统有三个抽烟者进程和一个供应者进程。每个抽烟者不停地卷烟并抽掉它，但是要卷起并抽掉一支烟，抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中，第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料，供应者每次将两种材料放桌子上，拥有剩下那种材料的抽烟者卷一根烟并抽掉它，并给供应者进程一个信号告诉完成了，供应者就会放另外两种材料再桌上，这个过程一直重复(让三个抽烟者轮流地抽烟)。

2.如何解决

20.读者——写者问题

1.问题描述

有读者和写者两组并发进程，共享一个文件，当两个或两个以上的读进程同时访问共享数据时不会产生副作用（与消费者进程不同，读者进程并非取走数据），但若某个写进程和其他进程（读进程或写进程）同时访问共享数据时则可能导致数据不一致的错误。因此要求:

①允许多个读者可以同时对文件执行读操作;

②只允许一个写者往文件中写信息;

③任一写者在完成写操作之前不允许其他读者或写者工作;

④写者执行写操作前，应让已有的读者和写者全部退出。

2.如何实现

潜在的问题：只要读进程还在读，写进程就要一直堵塞等待，可能会饿死。因此在这种算法中，读进程优先。下面来实现“ 先来先服务”算法，这样就不会导致写进程饿死。

改进之后，之所以不会出现写者饥饿，是因为 P(w) 会使得写进程把后面所有进程阻塞，让 rw 尽快在上一个读进程中被释放。

3.总结

读者-写者问题为我们解决复杂的互斥问题提供了一个参考思路。
其核心思想在于设置了一个计数器count用来记录当前正在访问共享文件的读进程数。我们可以用count的值来判断当前进入的进程是否是第一个/最后一个读进程，从而做出不同的处理。
另外，对count变量的检查和赋值不能一气呵成导致了一些错误，如果需要实现“一气呵成”，自然应该想到用互斥信号量。
最后，还要认真体会我们是如何解决“写进程饥饿”问题的。

21.哲学家吃饭

1.问题描述

一张圆桌上坐着5名哲学家，每两个哲学家之间的桌上摆一根筷子，桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐，哲学家在思考时，并不影响他人。只有当哲学家饥饿时，才试图拿起左、右两根筷子（一根一根地拿起)。如果筷子已在他人手上，则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐，当进餐完毕后，放下筷子继续思考。

2.问题分析

1.关系分析。系统中有5个哲学家进程，5位哲学家与左右邻居对其中间筷子的访问是互斥关系。

2.整理思路。这个问题中只有互斥关系，但与之前遇到的问题不同的是，每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象，是哲学家问题的精髓。
3.信号量设置。定义互斥信号量数组chopstick[5]={1,1,1,1,1}，用于实现对5个筷子的互斥访问。并对哲学家按0~4编号，哲学家i左边的筷子编号为i，右边的筷子编号为(i+1)%5。

3.如何实现

如果使用下图所示的方法，则会导致死锁问题。

那么如何解决呢？

①可以对哲学家进程施加一些限制条件，比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的

②要求奇数号哲学家先拿左边的筷子，然后再拿右边的筷子，而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭，那么只会有其中一个可以拿起第一只筷子，另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。

这前两个约束条件破坏的都是循环等待（死锁产生的必要条件）

③仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子。

这个约束条件破坏的是请求与保持（死锁产生的必要条件）

下面用代码实现第三种方式。

22.管程

1. 为什么引入管程？

信号量机制存在的问题 : 编写程序困难、易出错。因此人们想设计一种机制，让程序员写程序时不需要再关注复杂的PV操作，让写代码更轻松。1973年，Brinch Hansen首次在程序设计语言(Pascal)中引入了“管程”成分――一种高级同步机制。

2.管程的定义和基本特征

管程相当于对临界区资源进行抽象而编写的一个类。

管程是一种特殊的软件模块，有这些部分组成:

1.局部于管程的共享数据结构说明; （一个类）

2.对该数据结构进行操作的一组过程; （类中的方法）

3．对局部于管程的共享数据设置初始值的语句; （类中的变量）

4.管程有一个名字。（类名）

管程的基本特征:

1．局部于管程的数据只能被局部于管程的过程所访问; （类中变量有自己的作用范围）

2.一个进程只有通过调用管程内的过程才能进入管程访问共享数据; 这种互斥特性是由编译器来实现的。

3．每次仅允许一个进程在管程内执行某个内部过程。

在这里插入图片描述

3.java中类似于管程的机制（单例模式）

23.死锁

1.含义

在并发环境下，各进程因竞争资源而造成的一种互相等待对方手里的资源，导致各进程都阻塞，都无法向前推进的现象，就是“死锁“。

发生死锁后若无外力干涉,这些进程都将无法向前推进。

2.死锁，饥饿，死循环的区别

死锁:各进程互相等待对方手里的资源，导致各进程都阻塞，无法向前推进的现象。
饥饿:由于长期得不到想要的资源，某进程无法向前推进的现象。比如:在短进程优先（SPF）算法中，若有源源不断的短进程到来，则长进程将一直得不到处理机，从而发生长进程“饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug 导致的，有时是程序员故意设计的。

3.死锁产生的必要条件

产生死锁必须同时满足一下四个条件，只要其中任一条件不成立，死锁就不会发生。

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备）。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源）。
不剥夺条件:进程所获得的资源在未使用完之前，不能由其他进程强行夺走，只能主动释放。
请求和保持条件:进程已经保持了至少一个资源，但又提出了新的资源请求，而该资源又被其他进程占有，此时请求进程被阻塞，但又对自己已有的资源保持不放。
循环等待条件:存在一种进程资源的循环等待链，链中的每一个进程已获得的资源同时被下一个进程所请求。

注意 : 发生死锁时一定有循环等待 , 但是发生循环等待时未必死锁（循环等待是死锁的必要不充分条件)

如果同类资源数大于1，则即使有循环等待，也未必发生死锁。但如果系统中每类资源都只有一个，那循环等待就是死锁的充分必要条件了。

4.什么时候会发生死锁

对系统资源的竞争。各进程对不可剥夺的资源（如打印机）的竞争可能引起死锁，对可剥夺的资源(CPU)的竞争是不会引起死锁的
进程推进顺序非法。请求和释放资源的顺序不当，也同样会导致死锁。例如，并发执行的进程P1、P2分别申请并占有了资源R1、R2，之后进程p1又紧接着申请资源R2，而进程p2又申请资源R1,两者会因为申请的资源被对方占有而阻塞，从而发生死锁。
信号量的使用不当也会造成死锁。如生产者-消费者问题中，如果实现互斥的P操作在实现同步的P操作之前，就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)

总之，对不可剥夺资源的不合理分配，可能导致死锁。

5.死锁的处理策略

预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
避免死锁。用某种方法防止系统进入不安全状态，从而避免死锁（银行家算法)
死锁的检测和解除。允许死锁的发生，不过操作系统会负责检测出死锁的发生，然后采取某种措施解除死锁。

24.预防死锁

25.避免死锁

11.什么是安全序列

所谓安全序列，就是指如果系统按照这种序列分配资源，则每个进程都能顺利完成。只要能找出一个安全序列，系统就是安全状态。当然，安全序列可能有多个。
如果分配了资源之后，系统中找不出任何一个安全序列，系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然，如果有进程提前归还了一些资源，那系统也有可能重新回到安全状态，不过我们在分配资源之前总是要考虑到最坏的情况。
如果系统处于安全状态，就一定不会发生死锁。如果系统进入不安全状态，则可能会发生死锁。（不安全状态未必就是发生了死锁，但发生死锁时一定是在不安全状态)
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态，以此决定是否答应资源分配请求。这也是“银行家算法”的核心思想。

2.银行家算法

数据结构:
长度为m的一维数组 Available表示还有多少可用资源

nm矩阵Max表示各进程对资源的最大需求数

nm矩阵Allocation表示已经给各进程分配了多少资源

Max - Allocation = Need矩阵表示各进程最多还需要多少资源

用长度为m的一位数组Request表示进程此次申请的各种资源数

银行家算法步骤:
①检查此次申请是否超过了之前声明的最大需求数

②检查此时系统剩余的可用资源是否还能满足这次请求

③试探着分配，更改各数据结构

④用安全性算法检查此次分配是否会导致系统进入不安全状态

安全性算法步骤:
检查当前的剩余可用资源是否能满足某个进程的最大需求，如果可以，就把该进程加入安全序列，并把该进程持有的资源全部回收。
不断重复上述过程，看最终是否能让所有进程都加入安全序列。

26.死锁的检测和解除

1.死锁的检测

为了能对系统是否已发生了死锁进行检测，必须:

①用某种数据结构来保存资源的请求和分配信息;
②提供一种算法，利用上述信息来检测系统是否已进入死锁状态。

如果系统中剩余的可用资源数足够满足进程的需求，那么这个进程暂时是不会阻塞的，可以顺利地执行下去。如果这个进程执行结束了把资源归还系统，就可能使某些正在等待资源的进程被激活，并顺利地执行下去。相应的，这些被激活的进程执行完了之后又会归还一些资源，这样可能又会激活另外一些阻塞的进程.
如果按上述过程分析，最终能消除所有边，就称这个图是可完全简化的。此时一定没有发生死锁（相当于能找到一个安全序列)。
如果最终不能消除所有边，那么此时就是发生了死锁。

死锁定理:如果某时刻系统的资源分配图是不可完全简化的，那么此时系统死锁。

2.死锁的解除

一旦检测出死锁的发生，就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态，用死锁检测算法化简资源分配图后，还连着边的那些进程就是死锁进程
解除死锁的主要方法有 :

资源剥夺法。挂起（暂时放到外存上）某些死锁进程，并抢占它的资源，将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
撤销进程法（或称终止进程法）。强制撤销部分、甚至全部死锁进程，并剥夺这些进程的资源。这种方式的优点是实现简单，但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间，已经接近结束了，一旦被终止可谓功亏一篑，以后还得从头再来
进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息，设置还原点。

如何选择对哪些进程动手？