进程信号——阻塞与捕捉信号

最新推荐文章于 2023-07-10 08:00:00 发布

WoLannnnn

最新推荐文章于 2023-07-10 08:00:00 发布

阅读量1.5k

点赞数 10

分类专栏： linux 文章标签： linux 操作系统 c语言

本文链接：https://blog.csdn.net/aaaaaaaWoLan/article/details/122660969

版权

linux 专栏收录该内容

19 篇文章 2 订阅

订阅专栏

文章目录

阻塞信号
sigprocmask
sigpending
捕捉信号
可重入函数
volatile
SIGCHLD信号

阻塞信号

1.信号其他相关常见概念

实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态,称为信号未决(Pending)
进程可以选择阻塞 (Block )某个信号
被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作

2.在内核中的表示

信号在内核中的表示示意图

关于信号的保存：

我们暂时只关注前31个信号，图中的pending和block实际上是一个数据结构——位图

位图就像一个整型的32个比特位，而对于保存信号，我们要考虑的就是是否有信号让我们保存？保存哪个信号？

而对于pending位图：001000…00000，共有32个bit位，bit位所处的位置，也就是从左到右第几位，就代表是哪个信号的编号，而每个比特位上，是0还是1就代表有没有信号，0表示没有，1表示有。

同样的，对于block位图：001000…0000，有32个bit位，bit位所处的位置，就代表是哪个信号的编号，每个bit位上，0还是1代表是阻塞还是未阻塞，0表示未阻塞，1表示阻塞。

对于图中的handler，它实际上是个数组，保存的是对信号的处理方式，一共有三种：默认处理(SIG_DFL)，忽略(SIG_IGN)，以及自定义。而数组的下标就是对应信号的编号。

信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。

对图中三个信号的解析：

SIGHUP: 编号为1的信号，对应的block位图中数字是0，说明没有被该进程阻塞，而pending位图中是0，说明该信号没有产生，而handler中对该信号的处理方式是默认

SIGINT : 2号信号，虽然pending中数字为1，说明该信号产生了，但block中数字是1，代表该进程会被阻塞，且它的处理方式是忽略。

虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。

SIGQUIT 该信号没有产生，且如果产生了会被阻塞，它的处理方式是用户自定义的方式

因此我们也知道，一个信号还没有产生，我们是可以屏蔽(阻塞它的)

如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?

POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。我们不讨论实时信号

总结

一个进程和信号的关系：三张表(block,pending,handler)
处理信号的三种方法：默认、忽略、自定义

信号从产生到递达

图示:

信号产生：之前讲的四种方式

信号发送：由OS发送。信号发送了不会立即被处理

信号保存：由block位图和pending位图管理

信号处理：是阻塞还是接收

信号递达：是执行(默认方式还是自定义)还是忽略

3. sigset_t

从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略

注意：不能用简单的按位与和按位或来对pending表和block表来进行处理

4. 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统
实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做
任何解释,比如用printf直接打印sigset_t变量是没有意义的

#include <signal.h>
int sigemptyset(sigset_t *set);//将pending或block信号集全置为0，取决于set参数是哪个信号集
int sigfillset(sigset_t *set);//将pending或block信号集全置为1
int sigaddset (sigset_t *set, int signo);//在pending或block添加某个信号
int sigdelset(sigset_t *set, int signo);//在pending或block删除某个信号
int sigismember（const sigset_t *set, int signo);//判断pending或block中是否含有该信号

函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效号。
函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit位置为1,表示该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)

#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
返回值:若成功则为0,若出错则为-1

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。
如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。
如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

SIG_BLOCK set包含了我们希望添加到当前信号屏蔽字的信号，相当于mask = mask|set
SIG_UNBLOCK set包含了我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask = mask&~set
SIG_SETMASK 设置当前信号屏蔽字为set所指向的值，相当于mask = set

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达

SIG_BLOCK	set包含了我们希望添加到当前信号屏蔽字的信号，相当于mask = mask\|set
SIG_UNBLOCK	set包含了我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask = mask&~set
SIG_SETMASK	设置当前信号屏蔽字为set所指向的值，相当于mask = set

sigpending

#include <signal.h>
sigpending
读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。 下面用刚学的几个函数做个实验。程序如下:

对上面函数的一个应用：

#include<stdio.h>
#include<unistd.h>
#include<signal.h>

void show_pending(sigset_t pending)
{
  //1-31号信号
  int i = 1;
  for (; i < 32; ++i)
  {
    //如果i号信号在pending信号集中，则打印1
    if (sigismember(&pending, i))
    {
      printf("1");
    }
    else//如果不在就打印0
    {
      printf("0");    
    }
  }

  printf("\n");
}


int main()
{
  sigset_t pending;
  sigset_t block, oldblock;

  //将pending和block信号集置空
  sigemptyset(&pending);
  sigemptyset(&block);
  sigemptyset(&oldblock);

  //将2号信号设置为block，即ctrl+C
  sigaddset(&block, 2);//这只是将用户内存空间上的block变量的2号位置(可能是bit位)设置为1

  //这才是将进程的信号集进行了处理
  sigprocmask(SIG_SETMASK, &block, &oldblock);

  while (1)
  {
    sigpending(&pending);//获取当前进程的未决信号集
    show_pending(pending);//打印当前进程的未决信号集
    sleep(1);
  }

  return 0;
}

因为我们将pending信号集置空了，所以一开始是打印0。之后发送了2号信号，但2号信号被屏蔽了，所以进程没有被终止，2号信号处于未决状态，于是penging信号集中就多了一个1

程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会使SIGINT信号处于未决状态,按Ctrl+\仍然可以终止程序,因为SIGQUIT信号没有阻塞

将2号信号取消阻塞,并看到pending信号集中2号位置由1变0的过程：将oldblock设置位新的block，再将2号信号捕捉，自定义处理

#include<stdio.h>
#include<unistd.h>
#include<signal.h>

void show_pending(sigset_t pending)
{
  int i = 1;
  for (; i < 32; ++i)
  {
    //如果i号信号在pending信号集中，则打印1
    if (sigismember(&pending, i))
    {
      printf("1");
    }
    else//如果不在就打印0
    {
      printf("0");    
    }
  }

  printf("\n");
}

//自定义信号处理
void handle(int signo)
{
  printf("get a sig:%d\n", signo);
}

int main()
{
  sigset_t pending;
  sigset_t block, oldblock;

  //将pending和block信号集置空
  sigemptyset(&pending);
  sigemptyset(&block);
  sigemptyset(&oldblock);

  //将2号信号设置为block，即ctrl+C
  sigaddset(&block, 2);//这只是将用户内存空间上的block变量的2号位置(可能是bit位)设置为1

  //这才是将进程的信号集进行了处理
  sigprocmask(SIG_SETMASK, &block, &oldblock);

  int count = 0;
  while (1)
  {
    if (10 == count)
      break;
    sigpending(&pending);//获取当前进程的未决信号集
    show_pending(pending);//打印当前进程的未决信号集
    sleep(1);

    ++count;
  }

    //循环退出时，取消信号2的阻塞，并捕捉信号，完成递达
  signal(2, handle);
  sigprocmask(SIG_SETMASK, &oldblock, NULL);


  return 0;
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L8tJEeGd-1642986771123)(C:\Users\晏思俊\AppData\Roaming\Typora\typora-user-images\image-20211008135340373.png)]$

捕捉信号

1. 内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。

由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。当前正在执行main函数,这时发生中断或异常切换到内核态。在中断处理完毕后,要在返回用户态的main函数之前检查是否有信号递达。如果有，要确认是以什么方式处理该信号，是默认，忽略还是用户自定义。此图中，内核决定返回用户态,但不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

信号是何时递达的？

从内核态切换为用户态时进行相关的检测，上图的第三步和第五步都会进行信号的检测。

用户态和内核态的切换

1.什么是用户态和内核态的切换？

当我们使用了系统调用接口时，就必须让内核态帮我们执行代码，当然，让内核态执行代码的原因不只有这一种。

我们使用的printf、scanf等函数，虽然是C语言标准库提供的，但是，在这些函数实现的底层，还是使用了系统接口，所以，调用这些函数时，实际上就要切换到内核态来帮助我们完成代码。

2.为什么要进行用户态和内核态的切换？

因为我们的代码有些是需要内核态才能实现的，比如硬件的使用(将结果打印在显示器上，从键盘读取数据)等

3.内核态和用户态的切换是如何完成的？

所有进程的内核区映射的物理空间是一样的，不同于用户区的代码和数据。
用户态执行用户区代码(用户级页表映射)，内核态执行内核区代码(内核级页表映射)，当然内核态权限大，也可以执行用户区代码

那么，CPU怎么知道要执行哪份代码呢？

CPU中有一个寄存器，其中有一个值可以帮我们切换状态，OS修改该值，让CPU执行不同状态的代码。而进程的task_struct中可以与该寄存器建立联系。

用户和内核地址空间：

所以代码的执行实际上就和下图一样，在用户态和内核态之间进行多次切换

再重新归纳一下信号的处理过程：

我们将这5步用一个横着的“8”串联起来，箭头方向就表示执行顺序。

中间的横线表示内核态与用户态的边界，所以“8”与横线的交点就表示用户态与内核态的切换，而“8”的中心点可以理解成是信号的处理(由第3步到第4步)。这个“8”就概括了信号处理的整个大概流程

了解了整个过程后，我们注意一下，为什么执行自定义的信号处理方式要返回用户态呢？内核态不是也有权限可以执行吗？

答案是，自定义处理方式可能是恶意的，比如删除工作目录等，如果是内核态来执行这些动作，就没有保护措施，内核就傻呼呼地执行了，结果会造成很大地危害。

用上面知识解释下面的情况为什么越界了还会打印

#include<stdio.h>

int main()
{
  int i = 0;
  int arr[100];

  for (; i < 200; ++i)
  {
    arr[i] = i;//制造数组越界
  }
  printf("why run here?!\n");

  return 0;
}

执行结果：

因为printf上面的代码是用户态执行的，当越界访问内存时操作系统发了信号，信号是在内核态处理的，所以即使越界了，循环并不会停止，而是继续执行。当调用printf时，要进入内核态，处理完后，检测信号，检测到了OS发的信号，然后再处理该信号，结果就得到了段错误

2. sigaction

#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

sigaction函数可以读取和修改与指定信号相关联的处理动作(类似于signal函数)。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:

将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动
作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回
值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信
号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。

sa_sigaction、sa_restorer与实时信号有关，我们暂时不研究，当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。比如，如果我们当前2号信号已经阻塞了，但是还在继续发送2号信号，它还是一直处于阻塞状态，直到被接触阻塞。而如果我们在进行信号处理时，又有其他信号发送过来，所以，要想屏蔽哪些信号的话，就可以使用sa_mask

sa_flags字段包含一些选项,我们当前写的代码都把sa_flags设为0

使用示例

void handler(int signo)
{
	printf("get a sig:%d\n", signo);
}

int main()
{
    struct sigaction act, oldact;
    //修改信号的处理方式
    act.sa_handler = handler;
    act.sa_flags = 0;
    
    //不设置处理信号时的其他信号的屏蔽
    sigemptyset(&act.sa_mask);
    
    sigaction(2, &act, &oldact);//修改2号信号的处理方式
    
    while (1)
    {
		;//死循环期间发送2号信号，查看处理情况
    }
}

结果：

可重入函数

main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱?

如果一个函数符合以下条件之一则是不可重入的:

调用了malloc或free,因为malloc也是用全局链表来管理堆的。
调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile

该关键字在C当中我们已经有所涉猎，今天我们站在信号的角度重新理解一下

#include <stdio.h>
#include <signal.h>
    
int flag = 0;
void handler(int sig)
{
    //将flag改为1，即让main中的循环停止
    printf("change flag 0 to 1\n");
    flag = 1;
}
int main()
{
    signal(2, handler);
    while(!flag);
    printf("process quit normal\n");
    
    return 0;
}

[ysj@localhost code_test]$ cat Makefile
sig:sig.c
	gcc -o sig sig.c #-O2
.PHONY:clean
clean:
	rm -f sig
        
[ysj@localhost code_test]$ ./sig
^Cchage flag 0 to 1
process quit normal

标准情况下，键入 CTRL+C ,2号信号被捕捉，执行自定义动作，修改 flag＝1 ， while 条件不满足,退出循环，进程退出
#include <stdio.h>
#include <signal.h>

 int flag = 0;

void handler(int sig)
{
printf("chage flag 0 to 1\n");
  flag = 1;
}

int main()
{
signal(2, handler);
  while(!flag);

   printf("process quit normal\n");
  return 0;
}

[ysj@localhost code_test]$ cat Makefile
sig:sig.c
	gcc -o sig sig.c -O2
.PHONY:clean
clean:
	rm -f sig

[ysj@localhost code_test]$ ./sig
^Cchage flag 0 to 1
^Cchage flag 0 to 1
^Cchage flag 0 to 1
优化情况下(gcc test.c -o test -O2，优化等级为O2)，键入 CTRL-C ,2号信号被捕捉，执行自定义动作，修改 flag＝1 ，但是 while 条件依旧满足,进程继续运行！但是flag肯定已经被修改了，但是为何循环依旧执行？很明显， while 循环检查的flag，并不是内存中最新的flag，这就存在了数据二异性的问题。 while 检测的flag其实因为优化，被放在了CPU寄存器当中。所以即使我们更新了flag在内存中的值，它在寄存器中的值依旧是0。如何解决呢？需要 volatile
[ysj@localhost code_test]$ cat sig.c
#include <stdio.h>
#include <signal.h>
volatile int flag = 0;

void handler(int sig)
{
 printf("chage flag 0 to 1\n");
  flag = 1;
}

int main()
{
 signal(2, handler);
  while(!flag);

  printf("process quit normal\n");
  return 0;
}

[ysj@localhost code_test]$ cat Makefile
sig:sig.c
	gcc -o sig sig.c -O2
.PHONY:clean
clean:
	rm -f sig

[ysj@localhost code_test]$ ./sig
^Cchage flag 0 to 1
process quit normal
volatile 作用：保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量
的任何操作，都必须在真实的内存中进行操作，不能从中间的存储位置操作

SIGCHLD信号

进程讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。

其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。

请编写一个程序完成以下功能:父进程fork出子进程,子进程调用exit(2)终止,父进程自定义SIGCHLD信号的处理函数,在其中调用wait获得子进程的退出状态并打印。

事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。

总结：子进程退出时会向父进程发送SIGCHLD信号，倘若父进程忽略该信号，子进程自动释放其资源，就不会进入僵尸状态

验证：

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>

//父进程执行handler
void handler(int sig)
{
    pid_t id;
    
    //等待任一子进程(当前只有一个)，当子进程已回收，则返回-1退出while循环
    while( (id = waitpid(-1, NULL, WNOHANG)) > 0)
    {
    	printf("wait child success: %d\n", id);
	}
    
	printf("child is quit! %d\n,and send a sig:%d\n", getpid(), signo);
}

int main()
{
    signal(SIGCHLD, handler);//将SIGCHLD信号的处理方式改为自定义
    pid_t cid;
    
    //子进程睡眠3s退出
    if((cid = fork()) == 0)//child
    {
        printf("child : %d\n", getpid());
        sleep(3);
        exit(1);
	}
    
    //父进程的执行，死循环的过程中，子进程退出，所以收到SIGCHLD信号，进入handler函数
    while(1)
    {
        printf("father proc is doing something!\n");
        sleep(1);
    }
    
	return 0;
}

WoLannnnn

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
14
评论
进程信号——阻塞与捕捉信号

文章目录阻塞信号1.信号其他相关常见概念2.在内核中的表示总结信号从产生到递达3. sigset_t4. 信号集操作函数sigprocmasksigpending捕捉信号1. 内核如何实现信号的捕捉用户态和内核态的切换2. sigaction可重入函数volatileSIGCHLD信号阻塞信号1.信号其他相关常见概念实际执行信号的处理动作称为信号递达(Delivery)信号从产生到递达之间的状态,称为信号未决(Pending)进程可以选择阻塞 (Block )某个信号被阻塞的信号产生时将保持
复制链接

扫一扫