进程同步
背景
互相协作的进程之间有共享的数据,于是这里就有一个并发情况下,如何确保有序操作这些数据、维护一致性的问题,即进程同步。
从底层到高级应用,同步机制依次有临界区、信号量、管程、原子事务。
多个进程并发访问和操作同一数据且执行结果与访问发生的特定顺序有关,称之为竞争条件(race condition)。
临界区(critical section)
每个进程有一个代码段(code segment)称为临界区(critical section),在该区中进程可能改变共同变量、更新一个表或写一个文件等。这种系统的重要特征是当一个进程进入临界区,没有其他进程可被允许在临界区内执行,即没有两个进程可同时在临界区内执行。
临界资源(Critical resource)每次只能被一个进程访问。而临界区则是能够访问临界资源的代码片段。
临界区问题(critical-section problem)是设计一个以便进程协作的协议。每个进程必须请求允许进入其临界区。实现请求的代码段称为进入区(entry section),临界区之后可有退出区(exit section),其他代码段成为剩余区(remainder section)。
一个典型进程Pi的通用结构:
do{
进入区
临界区
退出区
剩余区
}while(TRUE)
临界区问题的解答必须满足三项要求:
(1)互斥(mutual exclusion):
如果进程Pi在其临界区内执行,那么其他进程都不能在其临界区内执行;(2)前进(progress):
如果没有进程在其临界区内执行且有进程需进入临界区,那么只有那么不在剩余区内执行的进程可参加选择,以确定谁能下一个进入临界区,且这种选择不能无限推迟;(3)有限等待(bounded waiting):
从一个进程做出进入临界区的请求,直到该请求允许为止,其他进程允许进入其临界区内的次数有上限。
一个操作系统,在某个时刻,可同时存在有多个处于内核模式的活动进程,因此实现操作系统的内核代码,会存在竞争条件。内核开发人员有必要确保其操作系统不会产生竞争条件。
有两种方法用于处理操作系统内的临界区问题:
抢占内核(preemptive kernel)与非抢占内核(nonpreemptive kernel):
抢占内核允许处于内核模式的进程被抢占。
非抢占内核不允许内核模式的进程被抢占。
非抢占内核的内核数据结构从根本上不会导致竞争条件,对于抢占内核需要认真设计以确保其内核数据结构不会导致竞争条件。
但抢占内核更受欢迎,因为抢占内核更适合实时编程,因为它能允许实时进程抢占处于内核模式运行的其他进程。再者,抢占内核的响应更快,因为处于内核模式的进程在释放CPU之前不会运行过久。
Peterson算法
Peterson算法是一种经典的基于软件的临界区问题算法,可能现代计算机体系架构基本机器语言有些不同,不能确保正确运行。
Peterson算法适用于两个进程在临界区与剩余区间交替执行,为了方便,当使用 Pi 时, Pj 来标示另一个进程,即 j=i−1 。Peterson算法需要在两个进程之间共享两个数据项:
int turn;
boolean flag[2];
变量turn表示哪个进程可以进入其临界区,即如果turn==i
,那么进程 Pi 允许在其临界区内执行。
数组flag表示哪个进程想要进入临界区,如果flag[i]为true,即 Pi 想进入其临界区。
//进程Pi的Peterson算法
do{
flag[i]=TRUE;
turn=j;
while(flag[j]&&turn==j);
临界区
flag[i]=FALSE;
剩余区
}while(TRUE)
可以证明,满足三项要求。
Peterson算法实际上是一种谦让的过程,即:
Pi :我已经准备好了,但是我让这次一次的turn=j
,看看 Pj 是否要运行,如果是的话,我就让 Pj 先运行。
Pj 也是这样的情况。
硬件同步
通过要求临界区用锁来防护,就可以避免竞争条件,即一个进程在进入临界区之前必须得到锁,而其退出临界区时释放锁。