6.8.1 kill、tkill和tgkill
kill函数的接口定义如下:
int kill(pid_t pid, int sig);
注意,不能望文生义,将kill函数的作用理解为杀死进程。
kill函数的作用是发送信号。
kill函数不仅可以向特定进程发送信号,也可以向特定进程组发送信号。
第一个参数pid的值,决定了kill函数的不同含义,具体来讲,可以分成以下几种情况。
-
pid>0:发送信号给进程ID等于pid的进程。
-
pid=0:发送信号给调用进程所在的同一个进程组的每一个进程。
-
pid=-1:有权限向调用进程发送信号的所有进程发出信号,init进程和进程自身除外。
-
pid<-1:向进程组-pid发送信号。
当函数成功时,返回0,失败时,返回-1,并置errno。
有一种情况很有意思,即调用kill函数时,第二个参数signo的值为0。
众所周知,没有一个信号的值是为0的,这种情况下,kill函数其实并不是真的向目标进程或进程组发送信号,而是用来检测目标进程或进程组是否存在。
如果kill函数返回-1且errno为ESRCH,则可以断定我们关注的进程或进程组并不存在。
发送信号的典型方法如下:
if(kill(3423,SIGUSR1) == -1)
{
/*error handler*/
}
如何向线程发送信号?
Linux提供了tkill和tgkill两个系统调用来向某个线程发送信号:
int tkill(int tid, int sig);
int tgkill(int tgid, int tid, int sig);
这两个都是内核提供的系统调用,glibc并没有提供对这两个系统调用的封装,所以如果想使用这两个函数,需要采用syscall的方式,如下:
ret = syscall(SYS_tkill,tid,sig)
ret = syscall(SYS_tgkill,tgid,tid,sig)
等一下,为什么有了tkill,还要引入tgkill?
int tkill(int tid, int sig);
int tgkill(int tgid, int tid, int sig);
实际上,tkill是一个过时的接口,并不推荐使用它来向线程发送信号。
相比之下,tgkill接口更加安全。
tgkill系统调用的第一个参数tgid,为线程组中主线程的线程ID,或者称为进程号。
这个参数表面看起来是多余的,其实它能起到保护的作用,防止向错误的线程发送信号。
进程ID或线程ID这种资源是由内核负责管理的,进程(或线程)有自己的生命周期,比如向线程ID为1234的线程发送信号时,很可能线程1234早就退出了,而线程ID 1234恰好被内核分配给了另一个不相干的进程。
这种情况下,如果直接调用tkill,就会将信号发送到不相干的进程上。
为了防止出现这种情况,于是内核引入了tgkill系统调用,含义是向线程组ID是tgid、线程ID为tid的线程发送信号。
这样,出现误杀的可能就几乎不存在了。
这两个函数都是Linux特有的,存在可移植性的问题。