Linux环境进程间通信系列(二):信号
1. 信号(上)
linux 信号机制远远比想象的复杂,本文力争用最短的篇幅,对该机制做了深入细致的分析。读者可以先读一下信号应用实例(在信号(下)中),这样可以对信号发送直到相应的处理函数执行完毕这一过程有个大致的印象。本文尽量给出了较新函数的应用实例,着重说明这些的功能。
一、信号及信号来源
信号本质
信号是在软件层次上对中断机制的一种模拟,在原理上,一个进程收到一个信号与处理器收到一个中断请求可以说是一样的。信号是异步的,一个进程不必通过任何操作来等待信号的到达,事实上,进程也不知道信号到底什么时候到达。
信号是进程间通信机制中唯一的异步通信机制,可以看作是异步通知,通知接收信号的进程有哪些事情发生了。信号机制经过 POSIX 实时扩展后,功能更加强大,除了基本通知功能外,还可以传递附加信息。
信号来源
信号事件的发生有两个来源:硬件来源 ( 比如我们按下了键盘或者其它硬件故障 ) ;软件来源,最常用发送信号的系统函数是 kill, raise, alarm 和 setitimer 以及 sigqueue 函数,软件来源还包括一些非法运算等操作。
二、信号的种类
可以从两个不同的分类角度对信号进行分类:( 1 )可靠性方面:可靠信号与不可靠信号;( 2 )与时间的关系上:实时信号与非实时信号。在《 Linux 环境进程间通信(一):管道及有名管道》的附 1 中列出了系统所支持的所有信号。
1 、可靠信号与不可靠信号
" 不可靠信号 "
Linux 信号机制基本上是从 Unix 系统中继承过来的。早期 Unix 系统中的信号机制比较简单和原始,后来在实践中暴露出一些问题,因此,把那些建立在早期机制上的信号叫做 " 不可靠信号 " ,信号值小于 SIGRTMIN(Red hat 7.2 中, SIGRTMIN=32 , SIGRTMAX=63) 的信号都是不可靠信号。这就是 " 不可靠信号 " 的来源。它的主要问题是:
•进程每次处理信号后,就将对信号的响应设置为默认动作。在某些情况下,将导致对信号的错误处理;因此,用户如果不希望这样的操作,那么就要在信号处理函数结尾再一次调用 signal() ,重新安装该信号。 •信号可能丢失,后面将对此详细阐述。
因此,早期 unix 下的不可靠信号主要指的是进程可能对信号做出错误的反应以及信号可能丢失。 Linux 支持不可靠信号,但是对不可靠信号机制做了改进:在调用完信号处理函数后,不必重新调用该信号的安装函数(信号安装函数是在可靠机制上的实现)。因此, Linux 下的不可靠信号问题主要指的是信号可能丢失。
" 可靠信号 "
随着时间的发展,实践证明了有必要对信号的原始机制加以改进和扩充。所以,后来出现的各种 Unix 版本分别在这方面进行了研究,力图实现 " 可靠信号 " 。由于原来定义的信号已有许多应用,不好再做改动,最终只好又新增加了一些信号,并在一开始就把它们定义为可靠信号,这些信号支持排队,不会丢失。同时,信号的发送和安装也出现了新版本:信号发送函数 sigqueue() 及信号安装函数 sigaction() 。 POSIX.4 对可靠信号机制做了标准化。但是, POSIX 只对可靠信号机制应具有的功能以及信号机制的对外接口做了标准化,对信号机制的实现没有作具体的规定。
信号值位于 SIGRTMIN 和 SIGRTMAX 之间的信号都是可靠信号,可靠信号克服了信号可能丢失的问题。 Linux 在支持新版本的信号安装函数 sigation ()以及信号发送函数 sigqueue() 的同时,仍然支持早期的 signal ()信号安装函数,支持信号发送函数 kill() 。
注:不要有这样的误解:由 sigqueue() 发送、 sigaction 安装的信号就是可靠的。事实上,可靠信号是指后来添加的新信号(信号值位于 SIGRTMIN 及 SIGRTMAX 之间);不可靠信号是信号值小于 SIGRTMIN 的信号。信号的可靠与不可靠只与信号值有关,与信号的发送及安装函数无关。目前 linux 中的 signal() 是通过 sigation() 函数实现的,因此,即使通过 signal ()安装的信号,在信号处理函数的结尾也不必再调用一次信号安装函数。同时,由 signal() 安装的实时信号支持排队,同样不会丢失。
对于目前 linux 的两个信号安装函数 :signal() 及 sigaction() 来说,它们都不能把 SIGRTMIN 以前的信号变成可靠信号(都不支持排队,仍有可能丢失,仍然是不可靠信号),而且对 SIGRTMIN 以后的信号都支持排队。这两个函数的最大区别在于,经过 sigaction 安装的信号都能传递信息给信号处理函数(对所有信号这一点都成立),而经过 signal 安装的信号却不能向信号处理函数传递信息。对于信号发送函数来说也是一样的。
2 、实时信号与非实时信号
早期 Unix 系统只定义了 32 种信号, Ret hat7.2 支持 64 种信号,编号 0-63(SIGRTMIN=31 , SIGRTMAX=63) ,将来可能进一步增加,这需要得到内核的支持。前 32 种信号已经有了预定义值,每个信号有了确定的用途及含义,并且每种信号都有各自的缺省动作。如按键盘的 CTRL ^C 时,会产生 SIGINT 信号,对该信号的默认反应就是进程终止。后 32 个信号表示实时信号,等同于前面阐述的可靠信号。这保证了发送的多个实时信号都被接收。实时信号是 POSIX 标准的一部分,可用于应用进程。
非实时信号都不支持排队,都是不可靠信号;实时信号都支持排队,都是可靠信号。
三、进程对信号的响应
进程可以通过三种方式来响应一个信号:( 1 )忽略信号,即对信号不做任何处理,其中,有两个信号不能忽略: SIGKILL 及 SIGSTOP ;( 2 )捕捉信号。定义信号处理函数,当信号发生时,执行相应的处理函数;( 3 )执行缺省操作, Linux 对每种信号都规定了默认操作,详细情况请参考 [2] 以及其它资料。注意,进程对实时信号的缺省反应是进程终止。
Linux 究竟采用上述三种方式的哪一个来响应信号,取决于传递给相应 API 函数的参数。
四、信号的发送
发送信号的主要函数有: kill() 、 raise() 、 sigqueue() 、 alarm() 、 setitimer() 以及 abort() 。
1 、 kill()
#include <sys/types.h>
#include <signal.h>
int kill(pid_t pid,int signo)
参数 pid 的值
信号的接收进程
pid>0
进程 ID 为 pid 的进程
pid=0
同一个进程组的进程
pid<0 pid!=-1
进程组 ID 为 -pid 的所有进程
pid=-1
除发送进程自身外,所有进程 ID 大于 1 的进程
Sinno 是信号值,当为 0 时(即空信号),实际不发送任何信号,但照常进行错误检查,因此,可用于检查目标进程是否存在,以及当前进程是否具有向目标发送信号的权限( root 权限的进程可以向任何进程发送信号,非 root 权限的进程只能向属于同一个 session 或者同一个用户的进程发送信号)。
Kill() 最常用于 pid>0 时的信号发送,调用成功返回 0 ; 否则,返回 -1 。注:对于 pid<0 时的情况,对于哪些进程将接受信号,各种版本说法不一,其实很简单,参阅内核源码 kernal/signal.c 即可,上表中的规则是参考 red hat 7.2 。
2 、 raise ()
#include <signal.h>
int raise(int signo)
向进程本身发送信号,参数为即将发送的信号值。调用成功返回 0 ;否则,返回 -1 。
3 、 sigqueue ()
#include <sys/types.h>
#include <signal.h>
int sigqueue(pid_t pid, int sig, const union sigval val)
调用成功返回 0 ;否则,返回 -1 。
sigqueue() 是比较新的发送信号系统调用,主要是针对实时信号提出的(当然也支持前 32 种),支持信号带有参数,与函数 sigaction() 配合使用。
sigqueue 的第一个参数是指定接收信号的进程 ID ,第二个参数确定即将发送的信号,第三个参数是一个联合数据结构 union sigval ,指定了信号传递的参数,即通常所说的 4 字节值。
typedef union sigval {
int sival_int;
void *sival_ptr;
}sigval_t;
sigqueue() 比 kill() 传递了更多的附加信息,但 sigqueue() 只能向一个进程发送信号,而不能发送信号给一个进程组。如果 signo=0 ,将会执行错误检查,但实际上不发送任何信号, 0 值信号可用于检查 pid 的有效性以及当前进程是否有权限向目标进程发送信号。
在调用 sigqueue 时, sigval_t 指定的信息会拷贝到 3 参数信号处理函数( 3 参数信号处理函数指的是信号处理函数由 sigaction 安装,并设定了 sa_sigaction 指针,稍后将阐述)的 siginfo_t 结构中,这样信号处理函数就可以处理这些信息了。由于 sigqueue 系统调用支持发送带参数信号,所以比 kill() 系统调用的功能要灵活和强大得多。
注: sigqueue ()发送非实时信号时,第三个参数包含的信息仍然能够传递给信号处理函数; sigqueue ()发送非实时信号时,仍然不支持排队,即在信号处理函数执行过程中到来的所有相同信号,都被合并为一个信号。
4 、 alarm ()
#include <unistd.h>
unsigned int alarm(unsigned int seconds)
专门为 SIGALRM 信号而设,在指定的时间 seconds 秒后,将向进程本身发送 SIGALRM 信号,又称为闹钟时间。进程调用 alarm 后,任何以前的 alarm() 调用都将无效。如果参数 seconds 为零,那么进程内将不再包含任何闹钟时间。
返回值,如果调用 alarm ()前,进程中已经设置了闹钟时间,则返回上一个闹钟时间的剩余时间,否则返回 0 。
5 、 setitimer ()
#include <sys/time.h>
int setitimer(int which, const struct itimerval *value, struct itimerval *ovalue));
setitimer() 比 alarm 功能强大,支持 3 种类型的定时器:
•ITIMER_REAL : 设定绝对时间;经过指定的时间后,内核将发送 SIGALRM 信号给本进程; •ITIMER_VIRTUAL 设定程序执行时间;经过指定的时间后,内核将发送 SIGVTALRM 信号给本进程; •ITIMER_PROF 设定进程执行以及内核因本进程而消耗的时间和,经过指定的时间后,内核将发送 ITIMER_VIRTUAL 信号给本进程; Setitimer() 第一个参数 which 指定定时器类型(上面三种之一);第二个参数是结构 itimerval 的一个实例,结构 itimerval 形式见附录 1 。第三个参数可不做处理。
Setitimer() 调用成功返回 0 ,否则返回 -1 。
6 、 abort()
#include <stdlib.h>
void abort(void);
向进程发送 SIGABORT 信号,默认情况下进程会异常退出,当然可定义自己的信号处理函数。即使 SIGABORT 被进程设置为阻塞信号,调用 abort() 后, SIGABORT 仍然能被进程接收。该函数无返回值。
五、信号的安装(设置信号关联动作)
如果进程要处理某一信号,那么就要在进程中安装该信号。安装信号主要用来确定信号值及进程针对该信号值的动作之间的映射关系,即进程将要处理哪个信号;该信号被传递给进程时,将执行何种操作。
linux 主要有两个函数实现信号的安装: signal() 、 sigaction() 。其中 signal() 在可靠信号系统调用的基础上实现 , 是库函数。它只有两个参数,不支持信号传递信息,主要是用于前 32 种非实时信号的安装;而 sigaction() 是较新的函数(由两个系统调用实现: sys_signal 以及 sys_rt_sigaction ),有三个参数,支持信号传递信息,主要用来与 sigqueue() 系统调用配合使用,当然, sigaction() 同样支持非实时信号的安装。 sigaction() 优于 signal() 主要体现在支持信号带有参数。
1 、 signal()
#include <signal.h>
void (*signal(int signum, void (*handler))(int)))(int);
如果该函数原型不容易理解的话,可以参考下面的分解方式来理解:
typedef void (*sighandler_t)(int) ;
sighandler_t signal(int signum, sighandler_t handler));
第一个参数指定信号的值,第二个参数指定针对前面信号值的处理,可以忽略该信号(参数设为 SIG_IGN );可以采用系统默认方式处理信号 ( 参数设为 SIG_DFL) ;也可以自己实现处理方式 ( 参数指定一个函数地址 ) 。
如果 signal() 调用成功,返回最后一次为安装信号 signum 而调用 signal() 时的 handler 值;失败则返回 SIG_ERR 。
2 、 sigaction()
#include <signal.h>
int sigaction(int signum,const struct sigaction *act,struct sigaction *oldact));
sigaction 函数用于改变进程接收到特定信号后的行为。该函数的第一个参数为信号的值,可以为除 SIGKILL 及 SIGSTOP 外的任何一个特定有效的信号(为这两个信号定义自己的处理函数,将导致信号安装错误)。第二个参数是指向结构 sigaction 的一个实例的指针,在结构 sigaction 的实例中,指定了对特定信号的处理,可以为空,进程会以缺省方式对信号处理;第三个参数 oldact 指向的对象用来保存原来对相应信号的处理,可指定 oldact 为 NULL 。如果把第二、第三个参数都设为 NULL ,那么该函数可用于检查信号的有效性。
第二个参数最为重要,其中包含了对指定信号的处理、信号所传递的信息、信号处理函数执行过程中应屏蔽掉哪些函数等等。
sigaction 结构定义如下:
struct sigaction {
union{
__sighandler_t _sa_handler;
void (*_sa_sigaction)(int,struct siginfo *, void *) ;
}_u
sigset_t sa_mask ;
unsigned long sa_flags ;
void (*sa_restorer)(void) ;
}
其中, sa_restorer ,已过时, POSIX 不支持它,不应再被使用。
1 、联合数据结构中的两个元素 _sa_handler 以及 *_sa_sigaction 指定信号关联函数,即用户指定的信号处理函数。除了可以是用户自定义的处理函数外,还可以为 SIG_DFL( 采用缺省的处理方式 ) ,也可以为 SIG_IGN (忽略信号)。
2 、由 _sa_handler 指定的处理函数只有一个参数,即信号值,所以信号不能传递除信号值之外的任何信息;由 _sa_sigaction 是指定的信号处理函数带有三个参数,是为实时信号而设的(当然同样支持非实时信号),它指定一个 3 参数信号处理函数。第一个参数为信号值,第三个参数没有使用( posix 没有规范使用该参数的标准),第二个参数是指向 siginfo_t 结构的指针,结构中包含信号携带的数据值,参数所指向的结构如下:
siginfo_t {
int si_signo; /* 信号值,对所有信号有意义 */
int si_errno; /* errno 值,对所有信号有意义 */
int si_code; /* 信号产生的原因,对所有信号有意义 */
union{ /* 联合数据结构,不同成员适应不同信号 */
// 确保分配足够大的存储空间
int _pad[SI_PAD_SIZE];
// 对 SIGKILL 有意义的结构
struct{
...
}...
... ...
... ...
// 对 SIGILL, SIGFPE, SIGSEGV, SIGBUS 有意义的结构
struct{
...
}...
... ...
}
}
注:为了更便于阅读,在说明问题时常把该结构表示为附录 2 所表示的形式。
siginfo_t 结构中的联合数据成员确保该结构适应所有的信号,比如对于实时信号来说,则实际采用下面的结构形式:
typedef struct {
int si_signo;
int si_errno;
int si_code;
union sigval si_value;
} siginfo_t;
结构的第四个域同样为一个联合数据结构:
union sigval {
int sival_int;
void *sival_ptr;
}
采用联合数据结构,说明 siginfo_t 结构中的 si_value 要么持有一个 4 字节的整数值,要么持有一个指针,这就构成了与信号相关的数据。在信号的处理函数中,包含这样的信号相关数据指针,但没有规定具体如何对这些数据进行操作,操作方法应该由程序开发人员根据具体任务事先约定。
前面在讨论系统调用 sigqueue 发送信号时, sigqueue 的第三个参数就是 sigval 联合数据结构,当调用 sigqueue 时,该数据结构中的数据就将拷贝到信号处理函数的第二个参数中。这样,在发送信号同时,就可以让信号传递一些附加信息。信号可以传递信息对程序开发是非常有意义的。
信号参数的传递过程可图示如下:
3 、 sa_mask 指定在信号处理程序执行过程中,哪些信号应当被阻塞。缺省情况下当前信号本身被阻塞,防止信号的嵌套发送,除非指定 SA_NODEFER 或者 SA_NOMASK 标志位。
注:请注意 sa_mask 指定的信号阻塞的前提条件,是在由 sigaction ()安装信号的处理函数执行过程中由 sa_mask 指定的信号才被阻塞。
4 、 sa_flags 中包含了许多标志位,包括刚刚提到的 SA_NODEFER 及 SA_NOMASK 标志位。另一个比较重要的标志位是 SA_SIGINFO ,当设定了该标志位时,表示信号附带的参数可以被传递到信号处理函数中,因此,应该为 sigaction 结构中的 sa_sigaction 指定处理函数,而不应该为 sa_handler 指定信号处理函数,否则,设置该标志变得毫无意义。即使为 sa_sigaction 指定了信号处理函数,如果不设置 SA_SIGINFO ,信号处理函数同样不能得到信号传递过来的数据,在信号处理函数中对这些信息的访问都将导致段错误( Segmentation fault )。
注:很多文献在阐述该标志位时都认为,如果设置了该标志位,就必须定义三参数信号处理函数。实际不是这样的,验证方法很简单:自己实现一个单一参数信号处理函数,并在程序中设置该标志位,可以察看程序的运行结果。实际上,可以把该标志位看成信号是否传递参数的开关,如果设置该位,则传递参数;否则,不传递参数。
六、信号集及信号集操作函数:
信号集被定义为一种数据类型:
typedef struct {
unsigned long sig[_NSIG_WORDS] ;
} sigset_t
信号集用来描述信号的集合, linux 所支持的所有信号可以全部或部分的出现在信号集中,主要与信号阻塞相关函数配合使用。下面是为信号集操作定义的相关函数:
#include <signal.h>
int sigemptyset(sigset_t *set) ;
int sigfillset(sigset_t *set) ;
int sigaddset(sigset_t *set, int signum)
int sigdelset(sigset_t *set, int signum) ;
int sigismember(const sigset_t *set, int signum) ;
sigemptyset(sigset_t *set) 初始化由 set 指定的信号集,信号集里面的所有信号被清空;
sigfillset(sigset_t *set) 调用该函数后, set 指向的信号集中将包含 linux 支持的 64 种信号;
sigaddset(sigset_t *set, int signum) 在 set 指向的信号集中加入 signum 信号;
sigdelset(sigset_t *set, int signum) 在 set 指向的信号集中删除 signum 信号;
sigismember(const sigset_t *set, int signum) 判定信号 signum 是否在 set 指向的信号集中。
七、信号阻塞与信号未决 :
每个进程都有一个用来描述哪些信号递送到进程时将被阻塞的信号集,该信号集中的所有信号在递送到进程后都将被阻塞。下面是与信号阻塞相关的几个函数:
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oldset)) ;
int sigpending(sigset_t *set));
int sigsuspend(const sigset_t *mask)) ;
sigprocmask() 函数能够根据参数 how 来实现对信号集的操作,操作主要有三种:
参数 how
进程当前信号集
SIG_BLOCK
在进程当前阻塞信号集中添加 set 指向信号集中的信号
SIG_UNBLOCK
如果进程阻塞信号集中包含 set 指向信号集中的信号,则解除对该信号的阻塞
SIG_SETMASK
更新进程阻塞信号集为 set 指向的信号集
sigpending(sigset_t *set)) 获得当前已递送到进程,却被阻塞的所有信号,在 set 指向的信号集中返回结果。
sigsuspend(const sigset_t *mask)) 用于在接收到某个信号之前 , 临时用 mask 替换进程的信号掩码 , 并暂停进程执行,直到收到信号为止。 sigsuspend 返回后将恢复调用之前的信号掩码。信号处理函数完成后,进程将继续执行。该系统调用始终返回 -1 ,并将 errno 设置为 EINTR 。
附录 1 :结构 itimerval :
struct itimerval {
struct timeval it_interval; /* next value */
struct timeval it_value; /* current value */
};
struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
};
附录 2 :三参数信号处理函数中第二个参数的说明性描述:
siginfo_t {
int si_signo; /* 信号值,对所有信号有意义 */
int si_errno; /* errno 值,对所有信号有意义 */
int si_code; /* 信号产生的原因,对所有信号有意义 */
pid_t si_pid; /* 发送信号的进程 ID, 对 kill(2), 实时信号以及 SIGCHLD 有意义 */
uid_t si_uid; /* 发送信号进程的真实用户 ID ,对 kill(2), 实时信号以及 SIGCHLD 有意义 */
int si_status; /* 退出状态,对 SIGCHLD 有意义 */
clock_t si_utime; /* 用户消耗的时间,对 SIGCHLD 有意义 */
clock_t si_stime; /* 内核消耗的时间,对 SIGCHLD 有意义 */
sigval_t si_value; /* 信号值,对所有实时有意义,是一个联合数据结构,可以为一个整数(由 si_int 标示,也可以为一个指针,由 si_ptr 标示) */
void * si_addr; /* 触发 fault 的内存地址,对 SIGILL,SIGFPE,SIGSEGV,SIGBUS 信号有意义 */
int si_band; /* 对 SIGPOLL 信号有意义 */
int si_fd; /* 对 SIGPOLL 信号有意义 */
}
实际上,除了前三个元素外,其他元素组织在一个联合结构中,在联合数据结构中,又根据不同的信号组织成不同的结构。注释中提到的对某种信号有意义指的是,在该信号的处理函数中可以访问这些域来获得与信号相关的有意义的信息,只不过特定信号只对特定信息感兴趣而已。
2. 信号(下)
在信号(上)中,讨论了 linux 信号种类、来源、如何安装一个信号以及对信号集的操作。本部分则首先讨论从信号的生命周期上认识信号,或者宏观上看似简单的信号机制(进程收到信号后,作相应的处理,看上去再简单不过了),在微观上究竟是如何实现的,也是在更深层次上理解信号。接下来还讨论了信号编程的一些注意事项,最后给出了信号编程的一些实例。
一、信号生命周期
从信号发送到信号处理函数的执行完毕
对于一个完整的信号生命周期 ( 从信号发送到相应的处理函数执行完毕 ) 来说,可以分为三个重要的阶段,这三个阶段由四个重要事件来刻画:信号诞生;信号在进程中注册完毕;信号在进程中的注销完毕;信号处理函数执行完毕。相邻两个事件的时间间隔构成信号生命周期的一个阶段。
下面阐述四个事件的实际意义:
1. 信号 " 诞生 " 。信号的诞生指的是触发信号的事件发生(如检测到硬件异常、定时器超时以及调用信号发送函数 kill() 或 sigqueue() 等)。
2. 信号在目标进程中 " 注册 " ;进程的 task_struct 结构中有关于本进程中未决信号的数据成员:
struct sigpending pending :
struct sigpending{
struct sigqueue *head, **tail;
sigset_t signal;
};
第三个成员是进程中所有未决信号集,第一、第二个成员分别指向一个 sigqueue 类型的结构链(称之为 " 未决信号信息链 " )的首尾,信息链中的每个 sigqueue 结构刻画一个特定信号所携带的信息,并指向下一个 sigqueue 结构 :
struct sigqueue{
struct sigqueue *next;
siginfo_t info;
}
信号在进程中注册指的就是信号值加入到进程的未决信号集中( sigpending 结构的第二个成员 sigset_t signal ),并且信号所携带的信息被保留到未决信号信息链的某个 sigqueue 结构中。只要信号在进程的未决信号集中,表明进程已经知道这些信号的存在,但还没来得及处理,或者该信号被进程阻塞。
注:
当一个实时信号发送给一个进程时,不管该信号是否已经在进程中注册,都会被再注册一次,因此,信号不会丢失,因此,实时信号又叫做 " 可靠信号 " 。这意味着同一个实时信号可以在同一个进程的未决信号信息链中占有多个 sigqueue 结构(进程每收到一个实时信号,都会为它分配一个结构来登记该信号信息,并把该结构添加在未决信号链尾,即所有诞生的实时信号都会在目标进程中注册);
当一个非实时信号发送给一个进程时,如果该信号已经在进程中注册,则该信号将被丢弃,造成信号丢失。因此,非实时信号又叫做 " 不可靠信号 " 。这意味着同一个非实时信号在进程的未决信号信息链中,至多占有一个 sigqueue 结构(一个非实时信号诞生后,( 1 )、如果发现相同的信号已经在目标结构中注册,则不再注册,对于进程来说,相当于不知道本次信号发生,信号丢失;( 2 )、如果进程的未决信号中没有相同信号,则在进程中注册自己)。
3. 信号在进程中的注销。在目标进程执行过程中,会检测是否有信号等待处理(每次从系统空间返回到用户空间时都做这样的检查)。如果存在未决信号等待处理且该信号没有被进程阻塞,则在运行相应的信号处理函数前,进程会把信号在未决信号链中占有的结构卸掉。是否将信号从进程未决信号集中删除对于实时与非实时信号是不同的。对于非实时信号来说,由于在未决信号信息链中最多只占用一个 sigqueue 结构,因此该结构被释放后,应该把信号在进程未决信号集中删除(信号注销完毕);而对于实时信号来说,可能在未决信号信息链中占用多个 sigqueue 结构,因此应该针对占用 sigqueue 结构的数目区别对待:如果只占用一个 sigqueue 结构(进程只收到该信号一次),则应该把信号在进程的未决信号集中删除(信号注销完毕)。否则,不应该在进程的未决信号集中删除该信号(信号注销完毕)。
进程在执行信号相应处理函数之前,首先要把信号在进程中注销。
4. 信号生命终止。进程注销信号后,立即执行相应的信号处理函数,执行完毕后,信号的本次发送对进程的影响彻底结束。
注:
1 )信号注册与否,与发送信号的函数(如 kill() 或 sigqueue() 等)以及信号安装函数( signal() 及 sigaction() )无关,只与信号值有关(信号值小于 SIGRTMIN 的信号最多只注册一次,信号值在 SIGRTMIN 及 SIGRTMAX 之间的信号,只要被进程接收到就被注册)。
2 )在信号被注销到相应的信号处理函数执行完毕这段时间内,如果进程又收到同一信号多次,则对实时信号来说,每一次都会在进程中注册;而对于非实时信号来说,无论收到多少次信号,都会视为只收到一个信号,只在进程中注册一次。
二、信号编程注意事项
1. 防止不该丢失的信号丢失。如果对八中所提到的信号生命周期理解深刻的话,很容易知道信号会不会丢失,以及在哪里丢失。
2. 程序的可移植性
考虑到程序的可移植性,应该尽量采用 POSIX 信号函数, POSIX 信号函数主要分为两类:
o POSIX 1003.1 信号函数: Kill() 、 sigaction() 、 sigaddset() 、 sigdelset() 、 sigemptyset() 、 sigfillset() 、 sigismember() 、 sigpending() 、 sigprocmask() 、 sigsuspend() 。
o POSIX 1003.1b 信号函数。 POSIX 1003.1b 在信号的实时性方面对 POSIX 1003.1 做了扩展,包括以下三个函数: sigqueue() 、 sigtimedwait() 、 sigwaitinfo() 。其中, sigqueue 主要针对信号发送,而 sigtimedwait 及 sigwaitinfo() 主要用于取代 sigsuspend() 函数,后面有相应实例。
#include <signal.h>
int sigwaitinfo(sigset_t *set, siginfo_t *info).
该函数与 sigsuspend() 类似,阻塞一个进程直到特定信号发生,但信号到来时不执行信号处理函数,而是返回信号值。因此为了避免执行相应的信号处理函数,必须在调用该函数前,使进程屏蔽掉 set 指向的信号,因此调用该函数的典型代码是:
sigset_t newmask;
int rcvd_sig;
siginfo_t info;
sigemptyset(&newmask);
sigaddset(&newmask, SIGRTMIN);
sigprocmask(SIG_BLOCK, &newmask, NULL);
rcvd_sig = sigwaitinfo(&newmask, &info)
if (rcvd_sig == -1) {
..
}
调用成功返回信号值,否则返回 -1 。 sigtimedwait() 功能相似,只不过增加了一个进程等待的时间。
3. 程序的稳定性。
为了增强程序的稳定性,在信号处理函数中应使用可重入函数。
信号处理程序中应当使用可再入(可重入)函数(注:所谓可重入函数是指一个可以被多个任务调用的过程,任务在调用时不必担心数据是否会出错)。因为进程在收到信号后,就将跳转到信号处理函数去接着执行。如果信号处理函数中使用了不可重入函数,那么信号处理函数可能会修改原来进程中不应该被修改的数据,这样进程从信号处理函数中返回接着执行时,可能会出现不可预料的后果。不可再入函数在信号处理函数中被视为不安全函数。
满足下列条件的函数多数是不可再入的:( 1 )使用静态的数据结构,如 getlogin() , gmtime() , getgrgid() , getgrnam() , getpwuid() 以及 getpwnam() 等等;( 2 )函数实现时,调用了 malloc ()或者 free() 函数;( 3 )实现时使用了标准 I/O 函数的。 The Open Group 视下列函数为可再入的:
_exit ()、access ()、alarm ()、cfgetispeed ()、cfgetospeed ()、cfsetispeed ()、cfsetospeed ()、chdir ()、chmod ()、chown ()、close ()、creat ()、dup ()、dup2 ()、execle ()、execve ()、fcntl ()、fork ()、fpathconf ()、fstat ()、fsync ()、getegid ()、 geteuid ()、getgid ()、getgroups ()、getpgrp ()、getpid ()、getppid ()、getuid ()、kill ()、link ()、lseek ()、mkdir ()、mkfifo ()、 open ()、pathconf ()、pause ()、pipe ()、raise ()、read ()、rename ()、rmdir ()、setgid ()、setpgid ()、setsid ()、setuid ()、 sigaction ()、sigaddset ()、sigdelset ()、sigemptyset ()、sigfillset ()、sigismember ()、signal ()、sigpending ()、sigprocmask ()、sigsuspend ()、sleep ()、stat ()、sysconf ()、tcdrain ()、tcflow ()、tcflush ()、tcgetattr ()、tcgetpgrp ()、tcsendbreak ()、tcsetattr ()、tcsetpgrp ()、time ()、times ()、 umask ()、uname ()、unlink ()、utime ()、wait ()、waitpid ()、write ()。
即使信号处理函数使用的都是 " 安全函数 " ,同样要注意进入处理函数时,首先要保存 errno 的值,结束时,再恢复原值。因为,信号处理过程中, errno 值随时可能被改变。另外, longjmp() 以及 siglongjmp() 没有被列为可再入函数,因为不能保证紧接着两个函数的其它调用是安全的。
三、深入浅出:信号应用实例
linux 下的信号应用并没有想象的那么恐怖,程序员所要做的最多只有三件事情:
1. 安装信号(推荐使用 sigaction() );
2. 实现三参数信号处理函数, handler(int signal,struct siginfo *info, void *) ;
3. 发送信号,推荐使用 sigqueue() 。
实际上,对有些信号来说,只要安装信号就足够了(信号处理方式采用缺省或忽略)。其他可能要做的无非是与信号集相关的几种操作。
实例一:信号发送及处理
实现一个信号接收程序 sigreceive (其中信号安装由 sigaction ())。
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
void new_op(int,siginfo_t*,void*);
int main(int argc,char**argv)
{
struct sigaction act;
int sig;
sig=atoi(argv[1]);
sigemptyset(&act.sa_mask);
act.sa_flags=SA_SIGINFO;
act.sa_sigaction=new_op;
if(sigaction(sig,&act,NULL) < 0)
{
printf("install sigal error\n");
}
while(1)
{
sleep(2);
printf("wait for the signal\n");
}
}
void new_op(int signum,siginfo_t *info,void *myact)
{
printf("receive signal %d", signum);
sleep(5);
}
说明,命令行参数为信号值,后台运行 sigreceive signo & ,可获得该进程的 ID ,假设为 pid ,然后再另一终端上运行 kill -s signo pid 验证信号的发送接收及处理。同时,可验证信号的排队问题。
注: 可以用 sigqueue 实现一个命令行信号发送程序 sigqueuesend ,见 附录 1 。
实例二:信号传递附加信息
主要包括两个实例:
1. 向进程本身发送信号,并传递指针参数;
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
void new_op(int,siginfo_t*,void*);
int main(int argc,char**argv)
{
struct sigaction act;
union sigval mysigval;
int i;
int sig;
pid_t pid;
char data[10];
memset(data,0,sizeof(data));
for(i=0;i < 5;i++)
data[i]='2';
mysigval.sival_ptr=data;
sig=atoi(argv[1]);
pid=getpid();
sigemptyset(&act.sa_mask);
act.sa_sigaction=new_op;// 三参数信号处理函数
act.sa_flags=SA_SIGINFO;// 信息传递开关
if(sigaction(sig,&act,NULL) < 0)
{
printf("install sigal error\n");
}
while(1)
{
sleep(2);
printf("wait for the signal\n");
sigqueue(pid,sig,mysigval);// 向本进程发送信号,并传递附加信息
}
}
void new_op(int signum,siginfo_t *info,void *myact)// 三参数信号处理函数的实现
{
int i;
for(i=0;i<10;i++)
{
printf("%c\n ",(*( (char*)((*info).si_ptr)+i)));
}
printf("handle signal %d over;",signum);
}
这个例子中,信号实现了附加信息的传递,信号究竟如何对这些信息进行处理则取决于具体的应用。
2. 2 、 不同进程间传递整型参数:把 1 中的信号发送和接收放在两个程序中,并且在发送过程中传递整型参数。
信号接收程序:
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
void new_op(int,siginfo_t*,void*);
int main(int argc,char**argv)
{
struct sigaction act;
int sig;
pid_t pid;
pid=getpid();
sig=atoi(argv[1]);
sigemptyset(&act.sa_mask);
act.sa_sigaction=new_op;
act.sa_flags=SA_SIGINFO;
if(sigaction(sig,&act,NULL)<0)
{
printf("install sigal error\n");
}
while(1)
{
sleep(2);
printf("wait for the signal\n");
}
}
void new_op(int signum,siginfo_t *info,void *myact)
{
printf("the int value is %d \n",info->si_int);
}
信号发送程序:命令行第二个参数为信号值,第三个参数为接收进程 ID 。
#include <signal.h>
#include <sys/time.h>
#include <unistd.h>
#include <sys/types.h>
main(int argc,char**argv)
{
pid_t pid;
int signum;
union sigval mysigval;
signum=atoi(argv[1]);
pid=(pid_t)atoi(argv[2]);
mysigval.sival_int=8;// 不代表具体含义,只用于说明问题
if(sigqueue(pid,signum,mysigval)==-1)
printf("send error\n");
sleep(2);
}
注: 实例 2 的两个例子侧重点在于用信号来传递信息,目前关于在 linux 下通过信号传递信息的实例非常少,倒是 Unix 下有一些,但传递的基本上都是关于传递一个整数,传递指针的我还没看到。我一直没有实现不同进程间的指针传递(实际上更有意义),也许在实现方法上存在问题吧,请实现者 email 我。
实例三:信号阻塞及信号集操作
#include "signal.h"
#include "unistd.h"
static void my_op(int);
main()
{
sigset_t new_mask,old_mask,pending_mask;
struct sigaction act;
sigemptyset(&act.sa_mask);
act.sa_flags=SA_SIGINFO;
act.sa_sigaction=(void*)my_op;
if(sigaction(SIGRTMIN+10,&act,NULL))
printf("install signal SIGRTMIN+10 error\n");
sigemptyset(&new_mask);
sigaddset(&new_mask,SIGRTMIN+10);
if(sigprocmask(SIG_BLOCK, &new_mask,&old_mask))
printf("block signal SIGRTMIN+10 error\n");
sleep(10);
printf("now begin to get pending mask and unblock SIGRTMIN+10\n");
if(sigpending(&pending_mask)<0)
printf("get pending mask error\n");
if(sigismember(&pending_mask,SIGRTMIN+10))
printf("signal SIGRTMIN+10 is pending\n");
if(sigprocmask(SIG_SETMASK,&old_mask,NULL)<0)
printf("unblock signal error\n");
printf("signal unblocked\n");
sleep(10);
}
static void my_op(int signum)
{
printf("receive signal %d \n",signum);
}
编译该程序,并以后台方式运行。在另一终端向该进程发送信号 ( 运行 kill -s 42 pid , SIGRTMIN+10 为 42) ,查看结果可以看出几个关键函数的运行机制,信号集相关操作比较简单。
注: 在上面几个实例中,使用了 printf() 函数,只是作为诊断工具, pringf() 函数是不可重入的,不应在信号处理函数中使用。
结束语:
系统地对 linux 信号机制进行分析、总结使我受益匪浅!感谢王小乐等网友的支持!
Comments and suggestions are greatly welcome!
附录 1 :
用 sigqueue 实现的命令行信号发送程序 sigqueuesend ,命令行第二个参数是发送的信号值,第三个参数是接收该信号的进程 ID ,可以配合实例一使用:
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
int main(int argc,char**argv)
{
pid_t pid;
int sig;
sig=atoi(argv[1]);
pid=atoi(argv[2]);
sigqueue(pid,sig,NULL);
sleep(2);
}
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/yufangbo/archive/2009/07/20/4364127.aspx