Linux进程信号详解

最新推荐文章于 2023-09-25 15:11:38 发布

GSX_M

最新推荐文章于 2023-09-25 15:11:38 发布

阅读量738

点赞数 2

分类专栏： Linux系统文章标签：服务器 Linux信号

本文链接：https://blog.csdn.net/m0_52169086/article/details/125478467

版权

Linux系统专栏收录该内容

21 篇文章 3 订阅

订阅专栏

一.理解信号的前提知识

1.人对于信号的反应

(1)信号产生前 (信号可以理解为事件)

信号还没有产生的时候，对于普通的人来讲，我们是知道信号产生之后，应该怎么做的!

①信号的到来我们要先识别出来，为何能识别？

有人曾经给我们对于这样的信号有 “教育” (将信号特征，如何识别，及其对应的处理过程记住了
) 过程.

②信号还没有产生的时候

信号有许多种类
信号产生的时候，和人的正常生活之间的运行关系是异步(不知道信号什么时候产生)

(2)信号产生中

信号产生的时候我们不一定立马去处理信号，因为有可能你正在做优先级更高的事情。

① 信号已到来，暂时没有处理，什么时候处理？在 " 合适 " 的时候处理

②此时这个信号，已经产生，但是暂时没有处理（存在时间窗口），你一定要有某种方式记下来这个信号已经产生

(3)信号产生后

处理信号的三个方式:

默认方式
忽略 (什么也不做，非常规)
自定义行为

2.信号产生的生命周期，人对应进程

(1)(信号产生前) 进程虽然现在没有收到任何信号，但是进程知道之后，收到信号之后，该怎么做.

进程内部一定能够识别信号
识别是程序员设计进程的时候，已经内置了处理方案
信号属于进程内部特有的特征

(2)(信号产生中) 当信号到来的时候，进程可能正在处理更重要的事情，信号可能不会被立即处理，等合适的时候在进行处理

信号来了，处理信号前，信号必须暂时被进程保管起来

(3)(信号产生后)对信号进行处理

默认行为(终止进程，暂停，继续运行等)
自定义行为
忽略信号

3.通过一段代码理解信号

(1)代码

(2)结果 : 死循环不断打印，通过Ctrl + C 终止进程

(3)为什么使用Ctrl+C后，该进程就终止了？

实际上当用户按Ctrl+C时，这个键盘输入会产生一个硬中断，被操作系统获取并解释成信号(Ctrl+C被解释成2号信号) ，然后操作系统将2号信号发送给目标前台进程，当前台进程收到2号信号后就会退出。

(4)使用signal函数对信号进行捕捉，自定义处理.

第一个参数是想要捕捉信号编号
第二个参数是捕捉信号的处理方法(一个函数)

①代码

#include<stdio.h>
#include<unistd.h>
#include<signal.h>

void handler(int signo)
{
  printf("get a signal: %d\n", signo);
}

int main()
{
  signal(2,handler);

  while(1){
    printf("I am running ... \n");
    sleep(1);
  }
  return 0;
}

②结果 : 此时当该进程收到2号信号后，就会执行自己定义的handler方法，而不会像之前一样直接退出了.

(5)补充

Ctrl+C产生的信号只能发送给前台进程。在一个命令后面加个&就可以将其放到后台运行，这样Shell就不必等待进程结束就可以接收新的命令，启动新的进程。
Shell可以同时运行一个前台进程和任意多个后台进程，但是只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
前台进程在运行过程中，用户随时可能按下Ctrl+C而产生一个信号，也就是说该进程的用户空间代码执行到任何地方都可能收到SIGINT信号而终止，所以信号相对于进程的控制流程来说是异步的。
信号是进程之间事件异步通知的一种方式，属于软中断。

4.信号的发送与记录

(1)查看所有信号 : kill -l

(2)其中1~31号信号是普通信号，34~64号信号是实时信号，普通信号和实时信号各自都有31个，每个信号都有一个编号和一个宏定义

(3)信号的记录

实际上，当一个进程接收到某种信号后，该信号是被记录在该进程的进程控制块(task_struc)当中的。我们都知道进程控制块本质上就是一个结构体变量，而对于信号来说我们主要就是记录某种信号是否产生; 比特位的位置代表信号的编号，而比特位的内容就代表是否收到对应信号

(4) 信号的发送

一个进程收到信号，本质就是该进程内的信号位图被修改了，也就是该进程的数据被修改了
而只有操作系统才有资格修改进程的数据，因为操作系统是进程的管理者。
信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图
信号只能由操作系统发送，但信号发送的方式有多种

5.信号处理常见方式概述

①执行该信号的默认处理动作。

②提供一个信号处理函数，要求内核在处理该信号时切换到用户态执行这个处理函数，这种方式称为捕捉（Catch）一个信号。

③忽略该信号

通过man手册查看各个信号默认的处理动作 man 7 signal

6.补充

(1)信号是一种事件发生的通知机制，即便事件没有发生，我们的程序也知道如何处理该事件。

(2)在OS层面进程帮我们处理信号(设置，捕捉)。

(3)信号也算通信，和之前讲的通信的区别是之前的通信是以传输数据为目的，信号本质是想把事件通知。

(4)为什么要有信号? 人一定要有处理突发事件的能力，进程也是如此。本质是让进程具有处理突发事件的能力

二.信号的产生

1.通过终端按键产生信号

(1)通过Ctrl + C , Ctrl + \终止进程

(2)Ctrl+C终止进程和Ctrl+\终止进程的区别

Ctrl+C实际是向进程发送2号信号SIGINT，Ctrl+\实际上是向进程发送3号信号SIGQUIT。而两个信号的处理动作不一样，2号信号是Term，而3号信号是Core。

Term和Core都代表着终止进程，但是Core在终止进程的时候会进行一个动作，那就是核心转储。

(3)什么是核心转储

①在云服务器中，核心转储是默认被关掉的，我们可以通过 ulimit -a 命令查看当前资源限制的设定。

②查看结果显示core文件的大小为0，即表示核心转储是被关闭的。

通过ulimit -c size命令来设置core文件的大小。

③再次使用Ctrl+\对进程进行终止，就会发现终止进程后会显显示Core dump

④在当前路径下生成一个core文件，该文件以一串数字为后缀，而这一串数字实际上就是发生这一次核心转储的进程的PID。

(4)核心转储功能的作用

当我们的代码出错了，我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了，那么我们可以通过退出码来判断代码出错的原因，而如果一个代码是在运行过程中出错的，那么我们也要有办法判断代码是什么原因出错的。
当我们的程序在运行过程中崩溃了，我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下，我们会用到核心转储，核心转储指的是操作系统在进程收到某些信号而终止运行时，将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中，这个磁盘文件也叫做核心转储文件，一般命名为core.pid。
核心转储的目的就是为了在调试时，方便问题的定位。

(5)云服务器为什么默认关闭core dump ，本地虚拟机环境是打开的?

core dump是给编译器看的(二进制文件)，只要程序core dump就要在磁盘中形成临时文件。一旦服务挂掉，搞运维的最重要的动作不是找到挂掉的原因，而是先让服务器跑起来，让服务正常运行，再找原因。服务挂掉了一定是大量的重启操作，大公司有自己的自动化重启程序，让它自动重启。
如果代码是自己写的，经常跑起来就挂，就会产生大量的临时文件，如果把部署目录塞满了。写不进去相关的日志信息，甚至是临时文件把系统盘打满了，系统无法正常运行。一般云服务器允许你异常，崩溃，但不允许core dump.
不是所有的信号都需要core dump

(6)运用core dump进行调试

①测试代码

②结果

③信号已经产生，为什么会执行最后一次打印

printf含有系统调用接口，从用户态到内核态执行打印，打印结束后从内核态->用户态进行了信号检测。

④使用gdb对当前可执行程序进行调试，然后直接使用core - file 命令加载core文件，即可判断出该程序在终止时收到了11号信号，是非法的地址访问。

事后用调试器检查core文件以查清错误原因，这种调试方式叫做事后调试。

⑤core dump标志

pid_t waitpid(pid_t pid, int *status, int options); //进程等待

waitpid函数的第二个参数status是一个输出型参数，用于获取子进程的退出状态。status是一个整型变量，但status不能简单的当作整型来看待，status的不同比特位所代表的信息不同，具体细节如下（只关注status低16位比特位）：

代码测试获取core dump ：打开Linux的核心转储功能，并编写下列代码。代码中父进程使用fork函数创建了一个子进程，子进程所执行的代码当中存在除0错误，必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态，根据status的第8个比特位便可得知子进程在被终止时是否进行了核心转储。

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
#include<stdlib.h>
#include<sys/wait.h>

int main()
{
  if(fork() == 0){
    printf("child running ...\n");
    int a = 10 / 0;

    exit(-1);
  }

  //father
  int status =0;
  waitpid(-1 , &status , 0);
  printf("exit code:%d, core dump:%d, signal:%d\n"
     , (status >> 8)&0xff , (status >> 7)&1 , status&0x7f );

  return 0;
}

(7)测试其他按键发送的信号

①将1~31号信号全部进行捕捉，将收到信号后的默认处理动作改为打印收到信号的编号。

②组合按键Ctrl+C、Ctrl+\、Ctrl+Z，查看信号

③ 向该进程发送9号信号，该进程并不会打印收到了9号信号，而是执行收到9号信号后的默认处理动作，即被终止

注意: 有些信号是不能被捕捉的，比如9号信号。因为如果所有信号都能被捕捉的话，那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,写一个病毒程序，此时该进程将无法被杀死，即便是操作系统。

2.通过系统函数向进程发送信号

(1)kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。

int kill(pid_t pid, int sig);

如果信号发送成功，则返回0，否则返回-1。

代码模拟实现:

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <signal.h>

void Usage(char* proc)
{
	printf("Usage: %s pid signo\n", proc);
}

int main(int argc, char* argv[])
{
	if (argc != 3){
		Usage(argv[0]);
		return 1;
	}
	pid_t pid = atoi(argv[1]);
	int signo = atoi(argv[2]);

	kill(pid, signo);
	return 0;
}

结果:

(2)raise函数

int raise(int sig);

raise函数可以给当前进程发送指定信号，即自己给自己发送信号，如果信号发送成功，则返回0，否则返回一个非零值.

代码测试:

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void handler(int signo)
{
	printf("get a signal:%d\n", signo);
}

int main()
{
	signal(2, handler);
	while (1){
		sleep(1);
		raise(2);
	}

	return 0;
}

每隔1s发送2号信号，被捕捉:

(3)abort函数

void abort(void);

abort函数可以给当前进程发送SIGABRT信号，使得当前进程异常终止

测试代码:

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

void handler(int signo)
{
   printf("get a signal:%d\n", signo);
}

int main()
{
  signal(SIGABRT, handler);

	while (1){
	  sleep(1);
      abort();
	}

	return 0;
}

结果: 虽然我们对SIGABRT信号进行了捕捉，并且在收到SIGABRT信号后执行了我们给出的自定义方法，但是当前进程依然是异常终止了。

注意： abort函数的作用是异常终止进程，exit函数的作用是正常终止进程，而abort本质是通过向当前进程发送SIGABRT信号而终止进程的，因此使用exit函数终止进程可能会失败，但使用abort函数终止进程总是成功的。

3.由软件条件产生的信号

(1)SIGPIPE信号

SIGPIPE信号实际上就是一种由软件条件产生的信号，当进程在使用管道进行通信时，读端进程将读端关闭，而写端进程还在一直向管道写入数据，那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。

(2)SIGALRM信号

①调用alarm函数可以设定一个闹钟，也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程

②函数 : unsigned int alarm(unsigned int seconds);

③alarm函数的作用就是，让操作系统在seconds秒之后给当前进程发送SIGALRM信号, SIGALRM信号的默认处理动作是终止进程。

④alarm函数的返回值：若调用alarm函数前，进程已经设置了闹钟，则返回上一个闹钟时间的剩余时间，并且本次闹钟的设置会覆盖上一次闹钟的设置。

⑤如果调用alarm函数前，进程没有设置闹钟，则返回值为0。

⑥代码测试:

#include <stdio.h>
#include <signal.h>
#include <unistd.h>

int main()
{
	int count = 0;
	alarm(1);
	while (1){
		count++;
		printf("count: %d\n", count);
	}

	return 0;
}

1)结果: 打印出来

2)结果 : 先计算，最后打印

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>

int count = 0;
void handler(int signo)
{
	printf("get a signal: %d\n", signo);
	printf("count: %d\n", count);
	exit(1);
}

int main()
{
	signal(SIGALRM, handler);
	alarm(1);
	while (1){
		count++;
	}

	return 0;
}

⑦两次代码测试中，count的值相差数量集很大的解释

主要原因有两个，首先，由于我们每进行一次累加就进行了一次打印操作，外设进行了IO操作，其次，由于我当前使用的是云服务器，因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来，因此最终显示的结果要比实际一秒内可累加的次数小得多。

一个体系结构中，IO是影响效率的最大因素

4.由硬件异常产生信号

(1)为什么C/C++程序会崩溃？

当我们程序当中出现类似于除0、野指针、越界之类的错误时，为什么程序会崩溃？本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止，那操作系统是如何识别到一个进程触发了某种问题的呢？
我们知道，CPU当中有一堆的寄存器，当我们需要对两个数进行算术运算时，我们是先将这两个操作数分别放到两个寄存器当中，然后进行算术运算并把结果写回寄存器当中。此外，CPU当中还有一组寄存器叫做状态寄存器，它可以用来标记当前指令执行结果的各种状态信息，如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者，在程序运行过程中，若操作系统发现CPU内的某个状态标志位被置位，而这次置位就是因为出现了某种除0错误而导致的，那么此时操作系统就会马上识别到当前是哪个进程导致的该错误，并将所识别到的硬件错误包装成信号发送给目标进程，本质就是操作系统去直接找到这个进程的task_struct，并向该进程的位图中写入8信号，写入8号信号后这个进程就会在合适的时候被终止。

(2)野指针访问测试

#include<stdio.h>
#include<signal.h>
#include<unistd.h>

void handler(int signo)
{
  printf("get a signal:%d\n" , signo);
  sleep(1);
}

int main()
{
 signal(11 ,handler);

 printf("begin ...\n");

  int* p;
  *p = 100;

 printf("end ...\n");

  return 0;
}

结果:

①运行的结果是一直打印获得11号信号，即OS一直想进程发送11号信号.

②错误没被纠正，硬件仍能检测出来，一直发信号。

③进程中的野指针在OS是如何被发现的?

指针变量里面放的是虚拟地址，想要访问数据要将虚拟地址转换为物理地址。野指针的虚拟地址在页表里没有到物理地址的映射关系，即使有，页表中还有一些标志位，某个空间不能写入。地址转化出现了错误，在页表硬件mmu中就出现了错误。OS是硬件的管理者，当OS发现页表硬件mmu错误，OS立即形成信号，杀掉这个进程。

④如果是除0错误如何发现

OS在进行正常运行的时候发现CPU内有一个计算它的状态寄存器发生了改变(硬件上的除0错误)，OS立马就定位到是我当前运行的哪个进程，所以OS识别到硬件错误将这个硬件错误解释成包装成信号发送给目标进程，本质就是OS去找到这个进程的PCB让目标进程的位图由0->1这个进程在合适的时候处理信号，进程执行对应信号的操作。

(3)深入理解硬件异常

其中页表属于一种软件映射关系，而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU，它是一种负责处理CPU的内存访问请求的计算机硬件，因此映射工作不是由CPU做的，而是由MMU做的，但现在MMU已经集成到CPU当中了。
当需要进行虚拟地址到物理地址的映射时，我们先将页表的左侧的虚拟地址导给MMU，然后MMU会计算出对应的物理地址，我们再通过这个物理地址进行相应的访问。
而MMU既然是硬件单元，那么它当然也有相应的状态信息，MMU的状态信息也会被OS看到,当我们要访问不属于我们的虚拟地址时，MMU在进行虚拟地址到物理地址的转换时就会出现错误，然后将对应的错误写入到自己的状态信息当中，这时硬件上面的信息也会立马被操作系统识别到，进而将对应进程发送SIGSEGV信号。
MMU = 硬件单元 + 页表(软件)
C/C++程序会崩溃，是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现，进而会被操作系统识别到，然后操作系统就会发送相应的信号将当前的进程终止。

三.阻塞信号

1.信号其他相关概念

实际执行信号的处理动作，称为信号递达（Delivery）。
信号从产生到递达之间的状态，称为信号未决（pending）。
进程可以选择阻塞（Block）某个信号。
被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作。
需要注意的是，阻塞和忽略是不同的，只要信号被阻塞就不会递达，而忽略是在递达之后的一种处理动作。

2.在内核中的表示

每个信号都有两个标志位分别表示阻塞（block）和未决（pending），还有一个函数指针表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。在上图中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会在改变处理动作之后再接触阻塞。
SIGQUIT信号未产生过，但一旦产生SIGQUIT信号，该信号将被阻塞，它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前，这种信号产生过多次, POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的：普通信号在递达之前产生多次只计一次，而实时信号在递达之前产生多次可以依次放在一个队列里，这里只讨论普通信号。
①代表:当前进程尚未收到1号信号，且尚未对1号信号进行屏蔽，当前对1号信号的处理动作是SIG_DEL默认的。
②代表当前进程目前收到了一个2号信号，但2号信号尚未被递达，因为该信号是被阻塞的，而万一解除阻塞，该信号被递达时，我们的处理动作是SIGING忽略。
③代表:当前进程尚未有3号信号，处于未决状态，且3号信号是被当前进程屏蔽/阻塞的，万一解除阻塞，快要递达时，递达处理动作是我们用户自定义的方法

小结:

在block位图中，比特位的位置代表某一个信号，比特位的内容代表该信号是否被阻塞。
在pending位图中，比特位的位置代表某一个信号，比特位的内容代表是否收到该信号。
handler表本质上是一个函数指针数组，数组的下标代表某一个信号，数组的内容代表该信号递达时的处理动作，处理动作包括默认、忽略以及自定义。
信号捕捉自定义处理时会把这个数组中函数指针进行修改，修改到自定义的内容。
block、pending和handler这三张表的每一个位置是一一对应的；信号的值代表数组的下标
OS给进程 "发送" 信号 -> OS向进程中写信号

3.sigset_t

(1)根据信号在内核中的表示方法，每个信号的未决标志只有一个比特位，非0即1，不记录该信号产生了多少次，阻塞标志也只有一个比特位。

(2)因此，未决和阻塞标志可以用相同的数据类型sigset_t来存储（不同操作系统实现sigset_t的方案可能不同）

(3)sigset_t称为信号集，这个类型可以表示每个信号的“有效”或“无效”状态。

在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞。
在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

(4)阻塞信号集也叫做当前进程的信号屏蔽字（Signal Mask），这里的“屏蔽”应该理解为阻塞而不是忽略。

4.信号集操作函数

(1)函数原型

#include <signal.h>

int sigemptyset(sigset_t *set);

int sigfillset(sigset_t *set);

int sigaddset(sigset_t *set, int signum);

int sigdelset(sigset_t *set, int signum);

int sigismember(const sigset_t *set, int signum);

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”，至于这个类型内部如何存储这些bit则依赖于系统的实现，从使用者的角度是不必关心的，使用者只能调用以下函数来操作sigset_t变量，而不应该对它的内部数据做任何解释，比如用printf直接打印sigset_t变量是没有意义的。

(2)函数作用解释

sigemptyset函数：初始化set所指向的信号集，使其中所有信号的对应bit清零，表示该信号集不包含任何有效信号。
sigfillset函数：初始化set所指向的信号集，使其中所有信号的对应bit置位，表示该信号集的有效信号包括系统支持的所有信号。
sigaddset函数：在set所指向的信号集中添加某种有效信号。
sigdelset函数：在set所指向的信号集中删除某种有效信号。
sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0，出错返回-1。
sigismember函数：判断在set所指向的信号集中是否包含某种信号，若包含则返回1，不包含则返回0，调用失败返回-1。

注意: 在使用sigset_t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号处于确定的状态。

(3)对于比特位的设置不能使用&│必须使用函数进行操作，因为你不确定位图的结构，有可能是个结构体。

(4)sigset_t类型的变量是定义在用户栈上的，对sigset_t变量进行的各种操作是不会影响进程的任何行为，最终通过系统调用设置进OS。

5.sigprocmask

int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

(1)sigprocmask函数可以用于读取或更改进程的信号屏蔽字（阻塞信号集）

(2)参数

如果oset是非空指针，则读取进程当前的信号屏蔽字通过oset参数传出。
如果set是非空指针，则更改进程的信号屏蔽字，参数how指示如何更改。
如果oset和set都是非空指针，则先将原来的信号屏蔽字备份到oset里，然后根据set和how参数更改信号屏蔽字。

(3)假设当前的信号屏蔽字为mask，how的选项

SIG_BLOCK set包含了我们希望添加到当前信号屏蔽字的信号，相当于mask=mask|set
SIG_UNBLOCK set包含了我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask=mask|~set
SIG_SETMASK 设置当前信号屏蔽字为set所指向的值，相当于mask=set

(4)返回值： sigprocmask函数调用成功返回0，出错返回-1。

注意： 如果调用sigprocmask解除了对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

6.sigpending

int sigpending(sigset_t *set);

(1) sigpending函数可以用于读取进程的未决信号集

(2) sigpending函数读取当前进程的未决信号集，并通过set参数传出。该函数调用成功返回0，出错返回-1。

7.代码测试，使用函数

(1)代码 : 先屏蔽2号信号，20s后再解除屏蔽，此间一直展示pending表的信息

#include <stdio.h>
#include <unistd.h>
#include <signal.h>

void printfPending(sigset_t* pending) //打印pending信号集
{
  int i =1;
  for( ; i <= 31 ; ++i){
    if(sigismember(pending , i)){
      printf("1 ");
    }
    else{
      printf("0 ");
    }
  }
  printf("\n");
}


void handler(int signo)
{
  printf("get signo: %d\n" , signo);
}

int main()
{
  signal(2,handler); //注册2号信号的处理方式

  sigset_t set,oset; //用户空间定义的变量
  sigemptyset(&set);
  sigemptyset(&oset);

  sigaddset(&set , 2);//SIGINT

  sigprocmask(SIG_SETMASK , &set , &oset); //覆盖block表，只有2号信号被阻塞

  int count = 0;
  sigset_t pending;
  while(1){
     sigemptyset(&pending); //pending信号集清空
     sigpending(&pending); //获取进程pending信号集信息

     printfPending(&pending); //打印pending信号集信息
     sleep(1);

     count++;
     if(count == 20){
       sigprocmask(SIG_SETMASK , &oset ,NULL);//恢复曾经的信号屏蔽字,所有的信号都不阻塞
       printf("recover: \n");
     }
  }
  return 0;
}

(2)结果

因为没有收到任何信号，所以此时该进程的pending表一直是全0，而当我们使用kill命令向该进程发送2号信号后，由于2号信号是阻塞的，因此2号信号一直处于未决状态，所以我们看到pending表中的第二个数字一直是1。
进程收到2号信号后，该信号在一段时间内处于未决状态，当解除2号信号的屏蔽后，2号信号就会立即递达，执行我们所给的自定义动作，而此时的pending表也变回了全0 , 之后再次发送2号信号时就直接捕捉了。

注意： 在解除2号信号后，2号信号的自定义动作是在打印“ recover ”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

四.信号的捕捉

1.内核态和用户态

(1)内核态与用户态：

内核态通常用来执行操作系统的代码，是一种权限非常高的状态。
用户态是一种用来执行普通用户代码的状态，是一种受监管的普通状态。

(2)进程收到信号之后，并不是立即处理信号，而是在合适的时候，这里所说的合适的时候实际上就是指，从内核态切换回用户态的时候 ,会进行信号的检测。

(3)内核态和用户态之间是进行如何切换的？

从用户态切换为内核态：

需要进行系统调用时。
当前进程的时间片到了，导致进程切换。
产生异常、中断、陷阱等。

从内核态切换为用户态：

系统调用返回时。
进程切换完毕。
异常、中断、陷阱等处理完毕

(4)其中，由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时，本质上是因为我们需要执行操作系统的代码，比如系统调用函数是由操作系统实现的，我们要进行系统调用就必须先由用户态切换为内核态。

2.内核空间与用户空间

每一个进程都有自己的进程地址空间，该进程地址空间由内核空间和用户空间组成
用户所写的代码和数据位于用户空间，通过用户级页表与物理内存之间建立映射关系。
内核空间存储的实际上是操作系统代码和数据，通过内核级页表与物理内存之间建立映射关系。
内核级页表是一个全局的页表 , 每个进程都能看到，它用来维护操作系统的代码与进程之间的关系。因此，在每个进程的进程地址空间中，用户空间是属于当前进程的，每个进程看到的代码和数据是完全不同的，但内核空间所存放的都是操作系统的代码和数据，所有进程看到的都是一样的内容。
进程无论如何切换，都能看到OS ，但是不一定都能访问

如何理解进程切换？

①在当前进程的进程地址空间中的内核空间，找到操作系统的代码和数据。
②执行操作系统的代码，将当前进程的代码和数据剥离下来，并换上另一个进程的代码和数据。

注意： 当你访问用户空间时你必须处于用户态，当你访问内核空间时你必须处于内核态。

3.内核如何实现信号的捕捉

①我们在执行主控制流程的时候，可能因为某些情况而陷入内核，当内核处理完毕准备返回用户态时，就需要进行信号pending的检查。（此时仍处于内核态，有权力查看当前进程的pending位图）
②在查看pending位图时，如果发现有未决信号，并且该信号没有被阻塞，那么此时就需要该信号进行处理。
③如果待处理信号的处理动作是默认或者忽略，则执行该信号的处理动作后清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，从主控制流程中上次被中断的地方继续向下执行即可。
④但如果待处理信号是自定义捕捉的，即该信号的处理动作是由用户提供的，那么处理该信号时就需要先返回用户态执行对应的自定义处理动作，执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，继续执行主控制流程的代码。

注意： sighandler和main函数使用不同的堆栈空间，它们之间不存在调用和被调用的关系，是两个独立的控制流程

(1)无穷大记法

该图形与直线有几个交点就代表在这期间有几次状态切换，而箭头的方向就代表着此次状态切换的方向，图形中间的圆点就代表着检查pending表。

(2)为啥执行自定义处理函数要从内核态 -> 用户态? 不切换也可以执行，但是为什么切换呢?

(内核态有权利执行用户态的代码)假如允许这么做，这个sighandler函数它里面有一些非法的动作，如删除目录，破坏文件，如果内核态做了，就会对OS造成伤害。内核态的权限非常大容易被恶意用户借刀杀人 (是谁的代码就让谁执行)
不能让操作系统直接去执行用户的代码，因为操作系统无法保证用户的代码是合法代码，即操作系统不信任任何用户。

4.sigaction

int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);

(1)捕捉信号除了用前面用过的signal函数之外，我们还可以使用sigaction函数对信号进行捕捉，

(2)sigaction函数可以读取和修改与指定信号相关联的处理动作，该函数调用成功返回0，出错返回-1。

(3)参数

signum代表指定信号的编号。
若act指针非空，则根据act修改该信号的处理动作。
若oldact指针非空，则通过oldact传出该信号原来的处理动作。

(4)关于struct sigaction

①第一个成员sa_handler

将sa_handler赋值为常数SIG_IGN传给sigaction函数，表示忽略信号。
将sa_handler赋值为常数SIG_DFL传给sigaction函数，表示执行系统默认动作。
将sa_handler赋值为一个函数指针，表示用自定义函数捕捉信号，或者说向内核注册了一个信号处理函数。

注意：所注册的信号处理函数的返回值为void，参数为int，通过参数可以得知当前信号的编号，这样就可以用同一个函数处理多种信号。显然这是一个回调函数，不是被main函数调用，而是被系统所调用。

②第二个成员sa_sigaction：

sa_sigaction是实时信号的处理函数。

③第三个成员sa_mask：

当某个信号的处理函数被调用，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。
如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时，自动恢复原来的信号屏蔽字。

④第四个成员sa_flags：

sa_flags字段包含一些选项，这里直接将sa_flags设置为0即可。

⑤第五个成员sa_restorer：不使用

(5)测试代码

用sigaction函数对2号信号进行了捕捉，将2号信号的处理动作改为了自定义的打印动作，并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作 , 即捕捉一次，再次发送2号信号时进程就会退出.

struct sigaction act,oact;

void handler(int signo)
{
  printf("get a signal: %d\n" , signo);
  sigaction(2 , &oact ,NULL);
}

int main()
{
  memset(&act ,0 ,sizeof(act));
  memset(&oact ,0 ,sizeof(oact)); //初始化空间


  act.sa_handler = handler;
  act.sa_flags = 0;
  sigemptyset(&act.sa_mask); //赋值

  sigaction(2 , &act ,&oact);
  while(1){
    printf("I am a process !\n");
    sleep(1);
  }

  return 0;
}

结果: 第一次捕捉，第二次进程终止

五.可重入函数

main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核(可能是进程的时间片到了),再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从 sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之, 如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。
想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱? 每个执行流调用的函数都有自己的函数栈帧，互不影响.

如果一个函数符合以下条件之一则是不可重入的：

调用了malloc或free，因为malloc也是用全局链表来管理堆的。
调用了标志I/O库函数，因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

六.站在OS角度理解volatile

volatile 作用：保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行操作，凡是被volatile修饰的变量是不可被 "覆盖"的.

(1)代码 : 代码的默认优化级别是01的, 我们对2号信号进行了捕捉，当该进程收到2号信号时会将全局变量flag由0置1。也就是说，在进程收到2号信号之前，该进程会一直处于死循环状态，直到收到2号信号时将flag置1才能够正常退出。

#include <stdio.h>
#include <signal.h>

int flag = 0;

void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	flag = 1;
}

int main()
{
	signal(2, handler); //执行流1
	while (!flag); //执行流2
	printf("process quit normal!\n");
	return 0;
}

结果: 打印出来两句话说明有两条执行流，且感受不到彼此的存在

(2)代码不做任何改变，编译时优化级别改为 -O3

就算发送2号信号，进程也不会终止.

①经过优化之后，handler中修改的是内存中的flag ，main函数中while循环检测的是寄存器中的flag.

②相当于寄存器的值把内存的值"覆盖"了,让CPU只能看到寄存器的值。

③编译器只能够对代码进行词法分析，语法分析，对于逻辑是无法检测的。逻辑是CPU执行过程中进行检测的。

④编译器在检测main执行流时会发现，flag变量在main函数中不会被修改，对于一个不可能被修改的变量而且while是要一直对flag进行检测的，所以编译器如果要进行优化的话，最好的方式是将该flag优化到寄存器变量中。就不需要从内存中读取flag变量到寄存器中了。检测一个数是否是0也是运算(算数运算，逻辑运算)只有CPU能进行计算。

(3)添加volatile关键字，告知编译器，对flag变量的任何操作都必须真实的在内存中进行，即保持了内存的可见性。

volatile flag = 0；

七.SIGCHLD

(1)为了避免出现僵尸进程，父进程需要使用wait或waitpid函数等待子进程结束，父进程可以阻塞等待子进程结束，也可以非阻塞地查询的是否有子进程结束等待清理，即轮询的方式。采用第一种方式，父进程阻塞就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

(2)其实，子进程在终止时会给父进程发生SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理动作，这样父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait或waitpid函数清理子进程即可

(3)下面代码中对SIGCHLD信号进行了捕捉，并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

①代码

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/wait.h>


void handler(int signo)
{
  printf("get a signal: %d\n" , signo);
  int ret = 0;
  while((ret = waitpid(-1,NULL,WNOHANG)) > 0){
    printf("wait child %d success!\n" , ret);
  } 
}

int main()
{
  signal(17 ,handler);

  if(fork() == 0){ //child
    printf("child is running  , begin dead ! :  %d\n" , getpid());
    sleep(3);
    exit(1);
  }

  //father
  while(1);

  return 0;
}

注意：

SIGCHLD属于普通信号，记录该信号的pending位只有一个，如果在同一时刻有多个子进程同时退出，那么在handler函数当中实际上只清理了一个子进程，这样的话其他子进程就没有回收，因此在使用waitpid函数清理子进程时需要使用while不断进行清理回收。
使用waitpid函数时，需要设置WNOHANG选项，即非阻塞式等待，否则当所有子进程都已经清理完毕时，由于while循环，会再次调用waitpid函数，此时就会在这里阻塞住, 导致程序在handler这里回不来；只要waitpid失败了就证明我把所有子进程都回收完了，然后再继续运行父进程。

②结果

(4)事实上，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的，但这是一个特列。此方法对于Linux可用，但不保证在其他UNIX系统上都可用。