简单的自定义sleep函数
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<signal.h>
#include<errno.h>
void cat_sig(int sig)
{
;
}
unsigned int mysleep(unsigned int seconds)
{
int ret;
struct sigaction act,oldact;
act.sa_handler=cat_sig;
sigemptyset(&act.sa_mask);
act.sa_flags=0;
ret=sigaction(SIGALRM,&act,&oldact);//注册捕捉信号,防止进程退出
if(ret==-1)
{
perror("sigaction error!");
exit(1);
}
alarm(seconds);
ret=pause(); //主动挂起,等待信号
if(ret==-1&&errno==EINTR)
{
printf("pause success!\n");
}
ret=alarm(0);//闹钟清零
sigaction(SIGALRM,&oldact,NULL);//恢复SIGALRM原有的处理方式。
return ret;
}
int main()
{
while(1)
{
mysleep(3);
printf("----------\n");
}
return 0;
}
时序竟态产生原因
以上程序中如果在pause()之前alarm计数没满的时候失去了CPU资源,当CPU资源重新回到这个进程上时,3秒已经过去了,SIGALRM信号已经处于递达态,CPU肯定会优先处理该信号的,这个信号处理之后,再来执行pause函数(注意,此时信号已经从未决状态释放,处于递达状态),pause之后进程等待信号唤醒,可是现在信号都没有,它就不会醒了。
对于这个小的测试程序来说出现这种状况的情况可以说是微乎其微,但如果是Linux服务器的一个核心程序,虽然这种概率比较小,但是服务器那是跑起来就不停的,在上千万次的运行中,出现这样的事也不奇怪,这个程序一停,损失就非常大了。
现在使用sigsuspend函数来解决这个问题
原型:int sigsuspend(const sigset_t *mask); :挂起等待信号。sigsuspend函数调用期间,进程信号屏蔽字由其参数mask指定。
可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,这样在调用sigsuspend时将解除对该信号的屏蔽,然后挂起等待,当sigsuspend返回时,进程的信号屏蔽字恢复为原来的值。如果原来该信号是屏蔽态,sigsuspend函数返回后仍然屏蔽该信号。
改进版的自定义mysleep函数
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
#include<fcntl.h>
#include<sys/types.h>
#include<signal.h>
void catch_sig(int sig)
{
;//空函数
}
unsigned int mysleep(unsigned int sec)
{
struct sigaction act,oldact;
sigset_t newmask,oldmask,suspmask;
unsigned int unslept;
//1.为SIGALRM设置捕捉函数,一个空函数
act.sa_handler=catch_sig;
sigemptyset(&act.sa_mask);
act.sa_flags=0;
sigaction(SIGALRM,&act,&oldact);
//2.设置阻塞信号集,阻塞SIGALRM信号
sigemptyset(&newmask);
sigaddset(&newmask,SIGALRM);
sigprocmask(SIG_BLOCK,&newmask,&oldmask);
//3.定时
alarm(sec);
//4.构造一个调用sigsuspend临时有效的阻塞信号集
//在临时阻塞信号集里解除SIGALRM的阻塞
suspmask=oldmask; //把原有的信号集赋值给临时集
sigdelset(&suspmask,SIGALRM); //确保解除SIGALRM的阻塞,原有信号集可能已经设置了阻塞
/*5.sigsuspend调用期间,采用临时阻塞集suspmask替换原有阻塞集
* 这个信号集中不包含SIGALRM
* 当sigsuspend被信号唤醒返回时,恢复原有的阻塞信号集*/
sigsuspend(&suspmask); //解除信号屏蔽和挂起等待信号合并为一个“原子操作”
/*如果此函数之前进程失去cpu,计时已满足(自然计时),SIGALRM被屏蔽处于未决状态
*执行此函数后,解除屏蔽,SIGALRM递达,执行捕捉函数同时进程被唤醒*/
unslept=alarm(0); //返回剩余时间
//6.恢复SIGALRM原有的处理动作,mysleep作为第三方接口,在返回时应该还原相应状态
sigaction(SIGALRM,&oldact,NULL);
//7.解除对SIGALRM的阻塞,还原阻塞集
sigprocmask(SIGALRM,&oldmask,NULL);
return unslept;
}
int main()
{
while(1)
{
mysleep(3);
printf("------timeout--------\n");
}
}
总结
时序问题分析
回顾,借助pause和alarm实现的mysleep函数。设想如下时序:
注册SIGALRM信号处理函数 (sigaction…)
调用alarm(3) 函数设定闹钟3秒。
函数调用刚结束,开始倒计时3秒。当前进程失去cpu,内核调度优先级高的进程(有多个)取代当前进程。当前进程无法获得cpu,进入就绪态等待cpu。
3秒后,闹钟超时,内核向当前进程发送SIGALRM信号(自然定时法,与进程状态无关),高优先级进程尚未执行完,当前进程仍处于就绪态,信号无法处理(未决)
优先级高的进程执行完,当前进程获得cpu资源,内核调度回当前进程执行。SIGALRM信号递达,信号设置捕捉,执行处理函数。
信号处理函数执行结束,返回当前进程主控流程,pause()被调用挂起等待。(欲等待alarm函数发送的SIGALRM信号将自己唤醒)
SIGALRM信号已经处理完毕,pause不会等到。
解决时序问题
可以通过设置屏蔽SIGALRM的方法来控制程序执行逻辑,但无论如何设置,程序都有可能在"解除信号屏蔽"与"挂起等待信号"这个两个操作间隙失去cpu资源。除非将这两步骤合并成一个"原子操作"。sigsuspend函数具备这个功能。在对时序要求严格的场合下都应该使用sigsuspend替换pause。
int sigsuspend(const sigset_t *mask); 挂起等待信号。
sigsuspend函数调用期间,进程信号屏蔽字由其参数mask指定。
可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,这样在调用sigsuspend时将解除对该信号的屏蔽,然后挂起等待,当sigsuspend返回时,进程的信号屏蔽字恢复为原来的值。如果原来对该信号是屏蔽态,sigsuspend函数返回后仍然屏蔽该信号
总结
竞态条件,跟系统负载有很紧密的关系,体现出信号的不可靠性。系统负载越严重,信号不可靠性越强。
不可靠由其实现原理所致。信号是通过软件方式实现(跟内核调度高度依赖,延时性强),每次系统调用结束后,或中断处理处理结束后,需通过扫描PCB中的未决信号集,来判断是否应处理某个信号。当系统负载过重时,会出现时序混乱。
这种意外情况只能在编写程序过程中,提早预见,主动规避,而无法通过gdb程序调试等其他手段弥补。且由于该错误不具规律性,后期捕捉和重现十分困难。