进程同步
1. 同步
进程同步机制的主要任务,是对进程在执行次序上进行协调,使并发执行的各个进程之间能按照一定的规则(或时序)共享系统资源,并能很好地相互合作,从而使程序的执行具有可再现性。
1.1 进程制约关系
在多道程序环境下,对于同处于一个系统中的多个进程,由于它们共享系统中的资源或为完成某一任务而相互合作,它们之间可能存在着以下两种形式的制约关系:
- 间接相互制约关系
对于打印机、摄像头等临界资源,必须保证多个进程对之只能互斥的访问,由此,在这些进程间形成了源于对该类资源共享的所谓间接相互制约关系。为了保证这些进程能有序地运行,对于系统中的这类资源,必须由系统实施统一分配,即用户在使用之前,应先提出申请,而不允许用户进程直接使用。
- 直接相互制约关系
对于某些应用程序,为了完成某任务而建立了两个或多个进程。这些进程将为完成同一任务而相互合作。进程间地直接制约关系就是源于它们之间地相互合作。
例如,我们去饭店吃饭,我们可以视作一个进程,而厨师呢则可以被视作另一个进程,我们要完成地任务就是厨师为我们做饭。我们负责吃饭,而厨师负责做饭。如果厨师正在做饭,那我们则等待厨师做好饭再吃。如果我们正在吃饭,那么厨师则等待我们吃完饭后,再询问我们是否还需要饭。
我们知道进程具有一个特性,便是异步性(进程在运行过程中能否得到处理机运行于以怎样地速度运行,并不由进程自身控制)。正是由于对共享变量或数据结构等资源不正确地访问次序,从而造成进程每次直接地结果不一致。而通过对进程次序进行协调,便可以解决异步所带来的错误。
1.2 同步对临界资源的访问
对于诸如打印机、摄像头等临界资源,都是采用互斥的方式进行访问,从而实现都这种资源的共享。
do{
entry section; // 进入区,负责检查是否可进入临界区,若可进入,则设置**正在访问临界资源的标志**,从而使其他进程不能进入。
critical section; // 访问临界资源的代码
exit section; // 负责解除 **正在访问临界资源的标志**,从而使其他进程可以进入临界区
remainder section; // 剩余区,做其他处理
}while(true)
注意
临界区是进程中访问临界资源的代码段。
进入区和退出区是负责实现互斥的代码段。
1.3 同步应遵循的规则
所有的同步机制都应遵循下述四条准则:
- 空闲让进。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区。
- 忙则等待。若已有进程进入临界区时,其他驶入进入临界区的进程必须等待。
- 有限等待。对请求访问的进程,应保证在有限时间内进入临界区(保证不会饥饿)。
- 让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。
1.4 硬件同步机制
- 中断屏蔽方法
利用“开/关中断指令”实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)
...
关中断 // 关中断后即不允许当前进程被中断,也必然不会发生进程切换
临界区
开中断 // 直到当前进程访问完临界区,在执行开中断指令,才有可能有别的进程上处理机并访问临界区
...
优点:简单、高效
缺点:不适用于多处理机;只适用于操作系统内核,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)
- TestAndSet
TSL
指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。
boolean TestAndSet(bool *lock){
bool old;
old = *lock;
*lock = true;
return old;
}
while(TestAndSet(&lock)); // “上锁”并“检查”
临界区代码段...
lock = false; // “解锁”
剩余区代码段
若刚开始 lock
是 false
,则TSL
返回的old
值为false
, while
循环条件不满足,直接跳过循环,进入临界区。若刚开始lock
是true
,则执行TLS
后old
返回的值为true
, while
循环条件满足,会一直循环,直到当前访问临界区的进程在退出区进行“解锁”。
相比软件实现方法,TSL
指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
- Swap 指令
有的地方也叫Exchange
指令,或简称XCHG
指令。
Swap
指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。
Swap (bool *a,bool *b) {
bool temp;
temp = *a;
*a = *b;
*b = temp;
}
//以下是用Swap指令实现互斥的算法逻辑
//lock表示当前临界区是否被加锁
bool old = true;
while (old == true)
Swap (&lock, &old);
临界区代码段...
lock = false;
剩余区代码段...
逻辑上来看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在 old 变量上),再将,上锁标记lock设置为true,最后检查old,如果old为false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
1.5 信号量机制
用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一-台打印机,就可以设置一个初值为1的信号量。
原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。
一对原语:wait(S)
原语和signal(S)
原语,可以把原语理解为我们自己写的函数,函数名分别为wait
和signal
,括号里的信号量S
其实就是函数调用时传入的一个参数。
wait
、signal
原语常简称为P
、V
操作。
- 整性信号量
用一个整数型的变量作为信号量,用来表示系统中某种资源的数量。
例:某计算机系统中有一台打印机
int S = 1; //初始化整型信号量s,表示当前系统中可用的打印机资源数
void wait (int S) { //wait 原语,相当于“进入区”
while (S <= 0); //如果资源数不够,就一直循环等待
S=S-1; //如果资源数够,则占用一个资源
}
void signal (int S) { //signal 原语,相当于“退出区”
S=S+1; // 使用完资源后,在退出区释放资源
}
各个进程执行如下代码:
...
wait(S); // 进入区,申请资源
使用打印机// 临界区,访问资源
signal(S); // 退出区,释放资源
- 记录型信号量
整型信号量的缺陷是存在“忙等”问题,因此人们又提出了“记录型信号量”,即用记录型数据结构表示的信号量。
/*记录型信号的定义*/
typedef struct {
int value; //剩余资源数
struct process *L ; // 等待队列
} semaphore;
如果剩余资源数不够,使用block原语使进程从运行态进入阻塞态,并把挂到信号量S的等待队列(即阻塞队列)中。
/*某进程需要使用资源时,通过wait原语申请*/
void wait (semaphore S) {
S.value-- ;
if(S.value<0){
block (S.L);
}
}
释放资源后,若还有别的进程在等待这种资源,则使用 wakeup 原语唤醒等待队列中的一个进程,该进程从阻塞态变为就绪态。
/*进程使用完资源后,通过signal原语释放*/
void signal (semaphore S) {
s.value++;
if (S.value <= 0) {
wakeup(S.L);
}
}
1.6 生产者-消费者问题
系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注: 这里的“产品”理解为某种数据)
生产者、消费者共享一个初始为空、大小为n的缓冲区。
只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。
只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。
缓冲区是临界资源,各进程必须互斥地访问。
首先分析题意,我们可以找到两组同步关系,一组互斥关系。
只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待,这是一组同步关系。
只有缓冲区不空时,消费者才能从中取出产品,否则必须等待,这是另一组同步关系。
缓冲区是临界资源,各进程必须互斥地访问。
// 有几个同步关系,则设置几个同步信号量
// 有几个互斥关系,则设置几个互斥信号量
semaphore mutex = 1; //互斥信号量,实现对缓冲区的互斥访问
semaphore empty = n; //同步信号量,表示空闲缓冲区的数量
semaphore full = 0; //同步信号量,表示产品的数量,也即非空缓冲区的数量
生产者代码:
producer(){
while(true){
生产一个产品
P(empty); // 消耗一个空缓冲区,如果 empty <= 0,那么生产者将阻塞到这里
P(mutex); // 对缓冲区的互斥访问
把产品放入缓冲区
V(mutex);
V(full); // 增加一个产品,这样被阻塞的消费者就可以向下执行
}
}
消费者代码:
consumer(){
while(true){
生产一个产品
P(full); // 消耗一个产品,如果 full <= 0,那么消费者将阻塞到这里
P(mutex); // 对缓冲区的互斥访问
把产品放入缓冲区
V(mutex);
V(empty); // 增加一个空闲缓冲区,这样被阻塞的生产者就可以向下执行
}
}
1.7 哲学家就餐问题
一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。
1.关系分析。系统中有5个哲学家进程,5位哲学家与左右邻居对其中间筷子的访问是互斥关系。
2.整理思路。这个问题中只有互斥关系,但与之前遇到的问题不同的事,每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的精髓。
3. 信号量设置。定义互斥信号量数组chopstick[5]={1,1,1,1,1}用于实现对5个筷子的互斥访问。并对哲学家按0~4编号,哲学家i左边的筷子编号为i,右边的筷子编号为(i+1)%5。
semaphore chopstick[5]={1,1,1,1,1};
Pi() { // i号哲学家的进程
while (1) {
P(chopstick[i]) ; //拿左
P(chopstick[ (i+1)号5]); //拿右
吃饭..
V(chopstick[i]) ; //放左
V(chopstick[ (i+1) 85]); //放右
思考...
}
}
倘若 5 位哲学家同时拿起自己左手边的筷子,那么没有人可以获得右边的筷子,此时便产生了死锁,各个进程无法向下执行。
如何防止死锁的发生?
①可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。
②要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。
③仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子。
semaphore chopstick[5]={1, 1,1,1,1} ;
semaphore mutex = 1 ; //互斥地取筷子
Pi(){ //i号哲学家的进程
while(1) {
P(mutex) ;
P(chopstick[i]) ; //拿左
P(chopstick[ (i+1) & 5]) ; //拿右
V(mutex) ;
吃饭...
V(chopstick[i]) ; //放左
V(chopstick[ (i+1) 85]) ;//放右
思考...
}
}
2. 死锁
并发环境下,各个进程因竞争资源而造成的一种相互等待对方手里的资源,导致各进程都阻塞,都无法向前推进的线程,就是“死锁”。
死锁、饥饿、死循环的区别:
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF) 算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机, 从而发生长进程“饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug导致的,有时是程序员故意设计的。
2.1 死锁产生的必要条件
产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生。
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
2.2 死锁的处理策略
1.预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
2.避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁( 银行家算法)
3.死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
2.3.1 预防死锁
- 破坏互斥条件
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。
该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
- 破环不可剥夺条件
方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。
方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式- -般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点:
1、实现起来比较复杂。
2、释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
3、反复地申请和释放资源会增加系统开销,降低系统吞吐量。
4、若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
- 破坏保持和请求条件
采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有, 该进程就不会再请求别的任何资源。
该策略实现起来简单,但也有明显的缺点
有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
- 破坏循环和等待条件
采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
该策略的缺点
1、不方便增加新的设备,因为可能需要重新分配所有的编号;
2、进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;
3、必须按规定次序申请资源,用户编程麻烦。
2.3.2 避免死锁
安全序列
所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个。
如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况。
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)
银行家算法
银行家算法的核心思想是:在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求,如果会进入不安全状态,就暂时不答应这次请求,让进程先阻塞。
加入资源总数为(10,5,7),根据上表可知剩余可用资源(3,3,2)。
说明如果优先把资源分配给P1,那P1一定是可以顺利执行结束的等P1结束了就会归还资源。于是资源数就可以增加到(2,0, 0)+(3,3, 2)=(5,3,2)。
以此类推资源回收 P1 的资源后可以分配给 P3,然后回收P3资源(此时剩余资源数为(5,3, 2)+(2,1, 1)=(7,4,3)),接着分配给 P0 ,然后回收 P0 的资源。最终我们发现,每个进程都可以成功分配所需的资源,此时便是一个安全序列,便不会产生死锁。
银行家算法的实现思路:
数据结构:
长度为m的一维数组Available表示还有多少可用资源
n*m矩阵Max表示各进程对资源的最大需求数
n*m矩阵Allocation表示已经给各进程分配了多少资源
Max-Allocation=Need矩阵表示各进程最多还需要多少资源
用长度为m的一位数组Request表示进程此次申请的各种资源数
银行家算法步骤:
①检查此次申请是否超过了之前声明的最大需求数
②检查此时系统剩余的可用资源是否还能满足这次请求
③试探着分配,更改各数据结构
④用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤:
检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。
不断重复上述过程,看最终是否能让所有进程都加入安全序列。.
2.3.3 检测和解除
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
①死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁。
②死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
死锁检测
为了能对系统是否已发生了死锁进行检测,必须:
①用某种数据结构来保存资源的请求和分配信息;
②提供一种算法,利用,上述信息来检测系统是否已进入死锁状态。
数据结构图:资源分配图
两种结点:
进程结点:对应一个进程
资源结点:对应一类资源,一类资源可能有多个
两种边:
进程结点一>资源结点:表示进程想申请几个资源(每条边代表一个)
资源节点一> 进程结点:表示已经为进程分配了几个资源(每条边代表一个)
算法思想
1)在资源分配图中,找出既不阻塞又不是孤点的进程Pi ( 即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配边,使之称为孤立的结点。
2)进程Pi所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。根据1)中的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的。
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁。
死锁解除
1.资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
2.撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
3. 进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。