【Linux操作系统】：Linux进程信号

-元清-

于 2024-08-09 15:32:54 发布

阅读量406

点赞数 12

分类专栏：【Linux操作系统】文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/weixin_74268082/article/details/140725382

版权

【Linux操作系统】专栏收录该内容

9 篇文章 1 订阅

订阅专栏

sigaction 函数（对信号进行捕捉）

可重入函数

volatile（保持内存的可见性）

SIGCHLD信号

信号的概念

生活角度的信号

我们在学校点外卖，在等待外卖的到来。但即便外卖还没有到来，我们也知道外卖到了的时候应该怎么处理外卖，我们需要下楼取快递，也就是我们能“识别外卖”。
我们并不清楚什么时候外卖会到达宿舍楼下了，外卖到来的整个过程，对我们来讲是异步的，我们不能确定你的外卖什么时候到。
当外卖到达宿舍楼下了，我们收到了外卖到了的电话，但是我们不一定要马上下楼拿外卖，也就是说拿外卖的行为并不是一定要立即执行，可以理解成在“在合适的时候去取”。
当我们时间合适，拿到外卖之后，就要开始处理外卖了，而处理外卖的方式有三种：1、执行默认动作（开炫）2、执行自定义动作（外卖是帮舍友买的，你要将外卖给他吃）3、忽略（拿到外卖后，放在一边继续做自己的事）。

我们代表的是谁？我们代表的就是进程

技术应用角度的信号

我们编写一个死循环的程序，如下：

#include <iostream>
#include <unistd.h>

int main()
{
    while (true)
    {
        std::cout << "runing..." << std::endl;
        sleep(1);
    }
    return 0;
}

我们可以使用 ctrl + c 来终止进程。

为什么使用Ctrl+C后，该进程就终止了？

实际上当用户按 Ctrl+C 时，这个键盘输入会产生一个硬中断，被操作系统获取并解释成信号（Ctrl+C被解释成2号信号），然后操作系统将2号信号发送给目标前台进程，当前台进程收到2号信号后就会退出。

我们可以使用 signal 函数 对2号信号进行捕捉，证明当我们按 Ctrl+C 时进程确实是收到了2号信号。signal 函数的详情如下：

#include <signal.h>

void (*signal(int signum, void (*handler)(int)))(int);

参数：

signum：表示要处理的信号编号，例如 SIGINT（中断信号，通常由 Ctrl + C 产生）、SIGTERM （终止信号）等。
handler：是一个函数指针，指向处理该信号的函数。

我们编写如下代码，当该进程收到2号信号（ctrl + c）后，就会执行我们给出的 handler 方法，而不会像之前一样直接退出了，因为此时我们已经将2号信号（ctrl + c）的处理方式由默认改为了自定义了。代码如下：

#include <iostream>
#include <signal.h>
#include <unistd.h>

void handler(int signum)
{
    std::cout << "我们收到一个" << signum << "信号" << std::endl;
    exit(0);
}
int main()
{
    // 捕捉2号信号
    signal(2,handler);
    while (true)
    {
        std::cout << "runing...,getpid()" << getpid() << std::endl;
        sleep(1);
    }
    return 0;
}

我们发现我们按 Ctrl+C 的时候，进程的处理方式确实是我们自定义的函数 handler。所以当我们按 Ctrl+C 时进程确实是收到了2号信号。

如何将程序放到后台运行

我们可以在命令后面加一个 & 就可以将程序放到后台运行，这样Shell不必等待进程结束就可以接受新的命令，启动新的进程！我们还可以使用 jobs 命令查看后台进程！

如何将后台进程放到前台运行？

fg 后台编号

如何将后台暂停的进程重新开始运行？

bg 后台编号

注意：

Ctrl+C产生的信号只能发送给前台进程。在一个命令后面加个 & 就可以将其放到后台运行，这样Shell就不必等待进程结束就可以接收新的命令，启动新的进程。
Shell可以同时运行一个前台进程和任意多个后台进程，但是只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
前台进程是不可以被暂停的，如果我们使用 ctrl + z 将前台进程暂停，那么这个进程将会被放到后台！

信号列表的查看

我们可以使用 kill -l 查看系统定义的信号列表

1~31号信号是普通信号，34~64号信号是实时信号
普通信号和实时信号各自都有31个，每个信号都有一个编号和一个宏定义名称

信号是如何记录的？

对于普通信号来讲，我们如何来判断进程是个否收到信号？

当一个进程接收到一个种信号后，该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量，而对于信号来说我们主要就是记录某种信号是否产生，因此，我们可以用一个32位的位图来记录信号是否产生。

其中比特位的位置代表信号的编号，而比特位的内容就代表是否收到对应信号，比如第2个比特位是1就表明收到了2号信号。

信号是如何产生的？

一个进程收到信号，本质就是该进程内的信号位图被修改了，也就是该进程的数据被修改了，而只有操作系统才有资格修改进程的数据，因为操作系统是进程的管理者。也就是说，信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。

注意：信号只能由操作系统发送，但信号发送的方式有多种。

信号处理常见方式

执行该信号的默认处理动作。
提供一个信号处理函数，要求内核在处理该信号时切换到用户态执行这个处理函数，这种方式称为捕捉（Catch）一个信号。
忽略该信号。

在Linux当中，我们可以通过man手册查看各个信号默认的处理动作。

信号的产生

键盘进行信号的产生

当面对下面的死循环程序时，我们都知道可以按Ctrl+C可以终止该进程。

#include <iostream>
#include <unistd.h>

int main()
{
    while (true)
    {
        std::cout << "runing..." << std::endl;
        sleep(1);
    }
    return 0;
}

但实际上除了按 Ctrl + C 之外，按 Ctrl + \ 也可以终止该进程。

按Ctrl+C终止进程和按Ctrl+\ 终止进程，有什么区别？

按 Ctrl + C 实际上是向进程发送2号信号 SIGINT
按 Ctrl + \ 实际上是向进程发送3号信号 SIGQUIT
查看这两个信号的默认处理动作，可以看到这两个信号的Action是不一样的，2号信号是Term，而3号信号是Core

Term 和 Core 都代表着终止进程，但是 Core 在终止进程的时候会进行一个动作，那就是核心转储。

什么是核心转储？

核心转储（Core Dump）是当一个程序异常终止或崩溃时，操作系统将程序当时的内存状态信息保存到一个文件中的过程。
核心转储文件包含了程序崩溃时的内存映像、寄存器状态、堆栈信息等，这些信息对于调试和分析程序崩溃的原因非常有用。
例如，如果一个程序由于访问了非法的内存地址而崩溃，通过分析核心转储文件，可以查看当时的内存布局、变量的值、函数调用栈等，从而帮助开发者找出导致崩溃的具体代码位置和错误原因。

我们可以通过使用 ulimit -a 命令查看当前资源限制的设定。

第一行显示core文件的大小为0，即表示核心转储是被关闭的。
我们可以通过 ulimit -c size 命令来设置core文件的大小，设置完成后即代表核心转储功能是已经被打开的了！

我们再次使用 ctrl + \ 终止进程，我们就会发现终止进程后会显示 core dumped。

并且会在当前路径下生成一个core文件，该文件以一串数字为后缀，而这一串数字实际上就是发生这一次核心转储的进程的PID。

有的时候 ulimit -c 已经是有大小或 unlimited了，怎么还是看不到core文件？？

我们可以使用如下命令：

man 5 core

查看手册中的core内容，然后往下翻：

这里面列举了几条不产生core文件的原因，你可以逐条对照。
最有可能的原因是 /proc/sys/kernel/core_pattern 文件里面把你的core文件发送到别处去了。
我的centos 系统默认就是这样干的。

然后打开/proc/sys/kernel/core_pattern 文件，里面如果不是像下图里我的这个这样：

而是显示的/proc/什么什么的，就代表它把你的core文件发到别的地方去了！

编辑这个文件，把它内容换成core 。在centos 系统上可以这样：

使用 echo 命令：
打开终端，以 root 权限运行以下命令：
sudo echo "new_pattern" > /proc/sys/kernel/core_pattern
请将 new_pattern 替换为您想要设置的新的核心转储文件命名模式。

注意：ulimit -c size 或 ulimit -c unlimited 只对当前会话有效。

核心转储功能有什么用？

当我们的代码出错了，我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了，那么我们可以通过退出码来判断代码出错的原因，而如果一个代码是在运行过程中出错的，那么我们也要有办法判断代码是什么原因出错的。

当我们的程序在运行过程中崩溃了，我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下，我们会用到核心转储，核心转储指的是操作系统在进程收到某些信号而终止运行时，将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中，这个磁盘文件也叫做核心转储文件，一般命名为core.pid。

而核心转储的目的就是为了在调试时，方便问题的定位。

如何运用核心转储进行调试？

我们用下面这段代码进行演示：

#include <stdio.h>
#include <unistd.h>

int main()
{
    int a = 100 / 0;
    return 0;   
}

很明显，该代码当中出现了除0错误，该程序运行后便会崩溃。

此时我们便可以在当前目录下看到核心转储时生成的core文件。

使用gdb对当前可执行程序进行调试，然后直接使用core-file core文件 命令加载core文件，即可判断出该程序在终止时收到了SIGFPE信号，并且定位到了产生该错误的具体代码。

注意：事后用调试器检查core文件以查清错误原因，这种调试方式叫做事后调试。

使用系统调用进行信号的产生

我们要使用kill 命令向一个进程发送信号，格式如下

kill -信号编号 进程ID

kill函数

实际上kill命令是通过调用kill函数实现的，kill函数可以给指定的进程发送指定的信号，kill函数的函数原型如下：

int kill(pid_t pid, int sig);

参数：

pid：进程的pid
sig：发生的信号编号

我们编写一个调用系统函数kill 的程序，如下：

#include <iostream>
#include <signal.h>
#include <unistd.h>

int main(int argc,char *argv[])
{
    // ./process -9 pid
    if (argc != 3)
    {
        // Uasge();
        exit(0);
    }
    int signumber = std::stoi(argv[1] + 1);
    int processpid = std::stoi(argv[2]);
    kill(processpid,signumber);

    return 0;
}

异常产生信号

当我们程序当中出现类似于 除0、野指针、越界之类的错误时，为什么程序会崩溃？

本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止，那操作系统是如何识别到一个进程触发了某种问题的呢？

那操作系统是如何识别到一个进程触发了某种问题的呢？（除0错误）

CPU当中有一堆的寄存器，当我们需要对两个数进行算术运算时，我们是先将这两个操作数分别放到两个寄存器当中，然后进行算术运算并把结果写回寄存器当中。
CPU当中还有一组寄存器叫做状态寄存器，它可以用来标记当前指令执行结果的各种状态信息，如有无进位、有无溢出等等。
而操作系统是软硬件资源的管理者，在程序运行过程中，若操作系统发现CPU内的某个状态标志位被置位，而这次置位就是因为出现了某种除0错误而导致的，那么此时操作系统就会马上识别到当前是哪个进程导致的该错误，并将所识别到的硬件错误包装成信号发送给目标进程。
本质就是操作系统去直接找到这个进程的task_struct，并向该进程的位图中写入8信号，写入8号信号后这个进程就会在合适的时候被终止。

那对于下面的野指针问题，或者越界访问的问题时，操作系统又是如何识别到的呢？

#include <stdio.h>
#include <unistd.h>

int main()
{
    printf("I am running...\n");
    sleep(2);
    int *p = NULL;
    *p = 100;
    return 0;
}

当我们要访问一个变量时，一定要先经过页表的映射，将虚拟地址转换成物理地址，然后才能进行相应的访问操作。

其中页表属于一种软件映射关系，而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU，它是一种负责处理CPU的内存访问请求的计算机硬件，因此映射工作不是由CPU做的，而是由MMU做的，但现在MMU已经集成到CPU当中了。
当需要进行虚拟地址到物理地址的映射时，我们先将页表的左侧的虚拟地址导给MMU，然后MMU会计算出对应的物理地址，我们再通过这个物理地址进行相应的访问。
而MMU既然是硬件单元，那么它当然也有相应的状态信息，当我们要访问不属于我们的虚拟地址时，MMU在进行虚拟地址到物理地址的转换时就会出现错误，然后将对应的错误写入到自己的状态信息当中，这时硬件上面的信息也会立马被操作系统识别到，进而将对应进程发送SIGSEGV信号。

由软件条件产生信号

13：SIGPIPE信号

下面代码当中，创建匿名管道进行父子进程之间的通信，其中父进程是读端进程，子进程是写端进程，但是一开始通信父进程就将读端关闭了，那么此时子进程在向管道写入数据时就会收到SIGPIPE信号，进而被终止。

#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
	int fd[2] = { 0 };
	if (pipe(fd) < 0)
    { 
		perror("pipe");
		return 1;
	}
	pid_t id = fork(); //使用fork创建子进程
	if (id == 0)
    {
		//child
		close(fd[0]); //子进程关闭读端
		//子进程向管道写入数据
		const char* msg = "hello father, I am child...";
		int count = 10;
		while (count--)
        {
			write(fd[1], msg, strlen(msg));
			sleep(1);
		}
		close(fd[1]); //子进程写入完毕，关闭文件
		exit(0);
	}
	//father
	close(fd[1]); //父进程关闭写端
	close(fd[0]); //父进程直接关闭读端（导致子进程被操作系统杀掉）
	int status = 0;
	waitpid(id, &status, 0);
	printf("child get signal:%d\n", status & 0x7F); //打印子进程收到的信号
	return 0;
}

14：SIGALRM信号

调用 alarm 函数可以设定一个闹钟，也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程，alarm函数的函数原型如下：

unsigned int alarm(unsigned int seconds);

alarm函数的作用就是，让操作系统在seconds秒之后给当前进程发送SIGALRM信号，SIGALRM信号的默认处理动作是终止进程。

alarm函数的返回值

若调用alarm函数前，进程已经设置了闹钟，则返回上一个闹钟时间的剩余时间，并且本次闹钟的设置会覆盖上一次闹钟的设置。
如果调用alarm函数前，进程没有设置闹钟，则返回值为0。

我们可以用下面的代码，测试自己的云服务器一秒时间内可以将一个变量累加到多大

#include <stdio.h>
#include <signal.h>
#include <unistd.h>

int main()
{
	int count = 0;
	alarm(1);
	while (1)
    {
		count++;
		printf("count: %d\n", count);
	}
	return 0;
}

当前的云服务器在一秒内可以将一个变量累加到八万左右。

但实际上我当前的云服务器在一秒内可以执行的累加次数远大于八万，那为什么上述代码运行结果比实际结果要小呢？

由于我们每进行一次累加就进行了一次打印操作，而与外设之间的IO操作所需的时间要比累加操作的时间更长
由于我当前使用的是云服务器，因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来，因此最终显示的结果要比实际一秒内可累加的次数小得多。

为了尽可能避免上述问题，我们可以先让count变量一直执行累加操作，直到一秒后进程收到SIGALRM信号后再打印累加后的数据。

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>

int count = 0;
void handler(int signo)
{
	printf("get a signal: %d\n", signo);
	printf("count: %d\n", count);
	exit(1);
}
int main()
{
	signal(SIGALRM, handler);
	alarm(1);
	while (1)
    {
		count++;
	}
	return 0;
}

此时 count 变量在一秒内被累加的次数变成了五亿多，由此也证明了，与计算机单纯的计算相比较，计算机与外设进行IO时的速度是非常慢的。

信号的保存

信号其他相关常见概念

实际执行信号的处理动作，称为信号递达（Delivery）。
信号从产生到递达之间的状态，称为信号未决（pending）。
进程可以选择阻塞（Block）某个信号。
被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作。
需要注意的是，阻塞和忽略是不同的，只要信号被阻塞就不会递达，而忽略是在递达之后的一种处理动作。

信号在内核中的表示

信号在内核中的表示示意图如下：

每个信号都有两个标志位分别表示阻塞（block）和未决（pending），还有一个函数指针表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。在上图中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会在改变处理动作之后再接触阻塞。
SIGQUIT信号未产生过，但一旦产生SIGQUIT信号，该信号将被阻塞，它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前，这种信号产生过多次，POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的：普通信号在递达之前产生多次只计一次，而实时信号在递达之前产生多次可以依次放在一个队列里，这里只讨论普通信号。

在阻塞（block）位图中，比特位的位置代表某一个信号，比特位的内容代表该信号是否被阻塞。（0代表未阻塞，1代表阻塞）
在未决（pending）位图中，比特位的位置代表某一个信号，比特位的内容代表是否收到该信号。（0代表未收到，1代表收到）
函数指针（handler）表本质上是一个函数指针数组，数组的下标代表某一个信号，数组的内容代表该信号递达时的处理动作，处理动作包括默认、忽略以及自定义。
阻塞（block）、未决（pending）和函数指针（handler）这三张表的每一个位置是一一对应的。

sigset_t

根据信号在内核中的表示方法，每个信号的未决（pending）标志只有一个比特位，非0即1，如果不记录该信号产生了多少次，那么阻塞（block）标志也只有一个比特位。

因此，未决（pending）和阻塞（block）标志可以用相同的数据类型 sigset_t 来存储。在我当前的云服务中，sigset_t 类型的定义如下：（不同操作系统实现sigset_t的方案可能不同）

#define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
typedef struct
{
	unsigned long int __val[_SIGSET_NWORDS];
} __sigset_t;

typedef __sigset_t sigset_t;

sigset_t 称为信号集，这个类型可以表示每个信号的“有效”或“无效”状态。

在阻塞（block）信号集中“有效”和“无效”的含义是该信号是否被阻塞。
在未决（pending）信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

阻塞（block）信号集也叫做当前进程的信号屏蔽字（Signal Mask），这里的“屏蔽”应该理解为阻塞（block）而不是忽略。

信号集操作函数

sigset_t 类型对于每种信号用一个比特位表示“有效”或“无效”，至于这个类型内部如何存储这些比特位则依赖于系统的实现，从使用者的角度是不必关心的
使用者只能调用以下函数来操作sigset_t 变量，而不应该对它的内部数据做任何解释，比如用printf 直接打印sigset_t 变量是没有意义的。

#include <signal.h>

int sigemptyset(sigset_t *set);

int sigfillset(sigset_t *set);

int sigaddset(sigset_t *set, int signum);

int sigdelset(sigset_t *set, int signum);

int sigismember(const sigset_t *set, int signum);

sigemptyset函数：初始化set 所指向的信号集，使其中所有信号的对应比特位清零，表示该信号集不包含任何有效信号。
sigfillset函数：初始化set 所指向的信号集，使其中所有信号的对应比特位置一，表示该信号集的有效信号包括系统支持的所有信号。
sigaddset函数：在set 所指向的信号集中添加某种有效信号（对应比特位置一）。
sigdelset函数：在set 所指向的信号集中删除某种有效信号（对应比特位置零）。
sigemptyset、sigfillset、sigaddset和sigdelset函数 都是成功返回0，出错返回-1。
sigismember函数：判断在set所指向的信号集中是否包含某种信号，若包含则返回1，不包含则返回0，调用失败返回-1。

注意：在使用sigset_t 类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号处于确定的状态。

例如，我们可以按照如下方式使用这些函数。

#include <stdio.h>
#include <signal.h>

int main()
{
	sigset_t s; //用户空间定义的变量

	sigemptyset(&s);

	sigfillset(&s);

	sigaddset(&s, SIGINT);

	sigdelset(&s, SIGINT);

	sigismember(&s, SIGINT);
	return 0;
}

注意： 代码中定义的sigset_t 类型的变量s，与我们平常定义的变量一样都是在用户空间定义的变量，所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改，并不会影响进程的任何行为。因此，我们还需要通过系统调用，才能将变量s的数据设置进操作系统。

读取或更改进程的阻塞信号集

sigprocmask函数可以用于读取或更改进程的信号屏蔽字（阻塞信号集），该函数的函数原型如下：

int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

参数：

如果oldset 是非空指针，则读取进程当前的信号屏蔽字通过oldset 参数传出。
如果set 是非空指针，则更改进程的信号屏蔽字，参数 how 指示如何更改。
如果oldset 和 set 都是非空指针，则先将原来的信号屏蔽字备份到 oldset 里，然后根据 set和 how 参数更改信号屏蔽字。

假设当前的信号屏蔽字为mask，下表说明了 how 参数的可选值及其含义：

选项	作用
SIG_BLOCK	set 包含了我们希望添加到当前信号屏蔽字的信号，相当于mask = mask \| set
SIG_UNBLOCK	set 包含了我们希望从当前信号屏蔽字中解除阻塞的信号，相当于 mask = mask \| ~set
SIG_SETMASK	设置当前信号屏蔽字为set所指向的值，相当于 mask = set

返回值：

sigprocmask函数调用成功返回0，出错返回-1。

注意： 如果调用sigprocmask函数 解除了对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

读取进程的未决信号集

sigpending函数 可以用于读取进程的未决信号集，该函数的函数原型如下：

int sigpending(sigset_t *set);

返回值：

sigpending函数调用成功返回0，出错返回-1

信号的处理

内核空间与用户空间

每一个进程都有自己的进程地址空间，该进程地址空间由内核空间和用户空间组成：

用户空间存储的实际上是用户的代码和数据，通过用户级页表与物理内存之间建立映射关系。
内核空间存储的实际上是操作系统代码和数据，通过内核级页表与物理内存之间建立映射关系。

内核级页表是一个全局的页表，它用来维护操作系统的代码与进程之间的关系。
每个进程的进程地址空间中，用户空间是属于当前进程的，每个进程看到的代码和数据是完全不同的
内核空间所存放的都是操作系统的代码和数据，所有进程看到的都是一样的内容。

如何理解进程切换？

在当前进程的进程地址空间中的内核空间，找到操作系统的代码和数据。
执行操作系统的代码，将当前进程的代码和数据剥离下来，并换上另一个进程的代码和数据。

注意： 当你访问用户空间时你必须处于用户态，当你访问内核空间时你必须处于内核态。

内核态与用户态

内核态与用户态：

内核态 通常用来执行操作系统的代码，是一种权限非常高的状态。
用户态 是一种用来执行普通用户代码的状态，是一种受监管的普通状态。

进程收到信号之后，并不是立即处理信号，而是在合适的时候，这里所说的合适的时候实际上就是指，从内核态切换回用户态的时候。

内核态和用户态之间是进行如何切换的？

从用户态切换为内核态通常有如下几种情况：

需要进行系统调用时。
当前进程的时间片到了，导致进程切换。
产生异常、中断、陷阱等。

从内核态切换为用户态有如下几种情况：

系统调用返回时。
进程切换完毕。
异常、中断、陷阱等处理完毕。

注意：

其中，由用户态切换为内核态我们称之为陷入内核。
每当我们需要陷入内核的时，本质上是因为我们需要执行操作系统的代码
比如系统调用函数是由操作系统实现的，我们要进行系统调用就必须先由用户态切换为内核态。

内核如何实现信号的捕捉

当我们在执行主控制流程的时候，可能因为某些情况而陷入内核，当内核处理完毕准备返回用户态时，就需要进行信号未决（pending）的检查。（此时仍处于内核态，有权力查看当前进程的未决（pending）位图）
在查看未决（pending）位图时，如果发现有未决信号，并且该信号没有被阻塞，那么此时就需要该信号进行处理。
如果待处理信号的处理动作是默认或者忽略，则执行该信号的处理动作后清除对应的未决（pending）标志位，如果没有新的信号要递达，就直接返回用户态，从主控制流程中上次被中断的地方继续向下执行即可。

如果待处理信号是自定义捕捉的，即该信号的处理动作是由用户提供的，那么处理该信号时就需要先返回用户态执行对应的自定义处理动作，执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的未决（pending）标志位，如果没有新的信号要递达，就直接返回用户态，继续执行主控制流程的代码。

注意： 自定义捕捉sighandler函数 和 main函数 使用不同的堆栈空间，它们之间不存在调用和被调用的关系，是两个独立的控制流程。

当识别到信号的处理动作是自定义时，能直接在内核态执行用户空间的代码吗？

理论上来说是可以的，因为内核态是一种权限非常高的状态，但是绝对不能这样设计。
如果允许在内核态直接执行用户空间的代码，那么用户就可以在代码中设计一些非法操作，比如清空数据库等，虽然在用户态时没有足够的权限做到清空数据库，但是如果是在内核态时执行了这种非法代码，那么数据库就真的被清空了，因为内核态是有足够权限清空数据库的。
也就是说，不能让操作系统直接去执行用户的代码，因为操作系统无法保证用户的代码是合法代码，即操作系统不信任任何用户。

sigaction 函数（对信号进行捕捉）

捕捉信号除了用前面用过的 signal函数 之外，我们还可以使用 sigaction函数 对信号进行捕捉，sigaction函数的函数原型如下：

int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);

参数：

signum代表指定信号的编号。
若act指针非空，则根据 act 修改该信号的处理动作。
若oldact指针非空，则通过 oldact 传出该信号原来的处理动作。

其中，参数act和oldact都是结构体指针变量，该结构体的定义如下：

struct sigaction 
{
	void(*sa_handler)(int);
	void(*sa_sigaction)(int, siginfo_t *, void *);
	sigset_t   sa_mask;
	int        sa_flags;
	void(*sa_restorer)(void);
};

结构体的第一个成员sa_handler

将sa_handler 赋值为常数SIG_IGN传给 sigaction函数，表示忽略信号。
将sa_handler 赋值为常数SIG_DFL传给 sigaction函数，表示执行系统默认动作。
将sa_handler 赋值为一个函数指针，表示用自定义函数捕捉信号，或者说向内核注册了一个信号处理函数。

注意： 所注册的信号处理函数的返回值为void，参数为int，通过参数可以得知当前信号的编号，这样就可以用同一个函数处理多种信号。显然这是一个回调函数，不是被main函数调用，而是被系统所调用。

结构体的第二个成员sa_sigaction

sa_sigaction是实时信号的处理函数。

结构体的第三个成员sa_mask

首先需要说明的是，当某个信号的处理函数被调用，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。

如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时，自动恢复原来的信号屏蔽字

结构体的第四个成员sa_flags：

sa_flags字段包含一些选项，这里直接将sa_flags 设置为0即可。

结构体的第五个成员sa_restorer：

该参数没有使用。

下面我们来做一个简单的实验

实验步骤如下：

我们用sigaction函数 对2号信号进行了捕捉
将2号信号的处理动作改为了自定义的打印动作
并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <signal.h>

struct sigaction act, oact;
void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	sigaction(2, &oact, NULL);
}
int main()
{
	memset(&act, 0, sizeof(act));
	memset(&oact, 0, sizeof(oact));

	act.sa_handler = handler;
	act.sa_flags = 0;
	sigemptyset(&act.sa_mask);

	sigaction(2, &act, &oact);
	while (1){
		printf("I am a process...\n");
		sleep(1);
	}
	return 0;
}

运行可执行程序，第一次向进程发送2号信号，执行我们自定义的打印动作
当我们再次向进程发送2号信号，就执行该信号的默认处理动作了，即终止进程。

可重入函数

下面主函数中调用insert函数向链表中插入结点node1，某信号处理函数中也调用了insert函数向链表中插入结点node2，乍眼一看好像没什么问题。

上述例子中，各函数执行的先后顺序如下：

像上例这样，insert函数被不同的控制流调用（main函数和sighandler函数使用不同的堆栈空间，它们之间不存在调用与被调用的关系，是两个独立的控制流程），有可能在第一次调用还没返回时就再次进入该函数，我们将这种现象称之为重入。

而insert函数访问一个全局链表，有可能因为重入而造成错乱，像这样的函数我们称之为不可重入函数
如果一个函数只访问自己的局部变量或参数，则称之为可重入（Reentrant）函数。

如果一个函数符合以下条件之一则是不可重入的：

调用了malloc或free，因为 malloc也是用全局链表来管理堆的。
调用了标志I/O库函数，因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile（保持内存的可见性）

volatile是C语言的一个关键字，该关键字的作用是保持内存的可见性。

下面我们来做一个简单的实验

在下面的代码中，我们对2号信号进行了捕捉，当该进程收到2号信号时会将全局变量flag 由0置1。
也就是说，在进程收到2号信号之前，该进程会一直处于死循环状态，直到收到2号信号时将flag置1才能够正常退出。

#include <stdio.h>
#include <signal.h>

int flag = 0;

void handler(int signo)
{
	printf("get a signal:%d\n", signo);
	flag = 1;
}
int main()
{
	signal(2, handler);
	while (!flag);
	printf("Proc Normal Quit!\n");
	return 0;
}

该程序的运行过程好像都在我们的意料之中，但实际并非如此。代码中的main函数和handler函数是两个独立的执行流，而while循环是在main函数当中的，在编译器编译时只能检测到在main函数中对flag变量的使用。
此时编译器检测到在main函数中并没有对flag变量做修改操作，在编译器优化级别较高的时候，就有可能将flag设置进寄存器里面。

此时main函数在检测flag时只检测寄存器里面的值，而handler执行流只是将内存中flag的值置为1了，那么此时就算进程收到2号信号也不会跳出死循环。
在编译代码时携带-O3选项使得编译器的优化级别最高，此时再运行该代码，就算向进程发生2号信号，该进程也不会终止。

面对这种情况，我们就可以使用volatile关键字对 flag变量进行修饰，告知编译器，对flag变量的任何操作都必须真实的在内存中进行，即保持了内存的可见性。

volatile int flag = 0;

此时就算我们编译代码时携带-O3选项，当进程收到2号信号将内存中的flag变量置1时，main函数执行流也能够检测到内存中flag变量的变化，进而跳出死循环正常退出。

SIGCHLD信号

为了避免出现僵尸进程，父进程需要使用wait或waitpid函数等待子进程结束
父进程可以阻塞等待子进程结束，也可以非阻塞地查询的是否有子进程结束等待清理，即轮询的方式。
采用第一种方式，父进程阻塞就不能处理自己的工作了；
采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

我们还有第三种方法

子进程在终止时会给父进程发SIGCHLD信号，该信号的默认处理动作是忽略。
父进程可以自定义SIGCHLD信号的处理动作，这样父进程就只需专心处理自己的工作，不必关心子进程了
子进程终止时会通知父进程，父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

下面我们来做一个简单的实验

例如，下面代码中对SIGCHLD信号进行了捕捉，并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/wait.h>

void handler(int signo)
{
	printf("get a signal: %d\n", signo);
	int ret = 0;
	while ((ret = waitpid(-1, NULL, WNOHANG)) > 0)
    {
		printf("wait child %d success\n", ret);
	}
}
int main()
{
	signal(SIGCHLD, handler);
	if (fork() == 0)
    {
		//child
		printf("child is running, begin dead: %d\n", getpid());
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}

注意事项：

SIGCHLD属于普通信号，记录该信号的未决（pending）位只有一个，如果在同一时刻有多个子进程同时退出，那么在handler函数当中实际上只清理了一个子进程，因此在使用waitpid函数清理子进程时需要使用while不断进行清理。
使用waitpid函数时，需要设置WNOHANG选项，即非阻塞式等待，否则当所有子进程都已经清理完毕时，由于while循环，会再次调用waitpid函数，此时就会在这里阻塞住。

此时父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时父进程收到SIGCHLD信号，会自动进行该信号的自定义处理动作，进而对子进程进行清理。

第四种方法

父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。
系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的，但这是一个特列。此方法对于Linux可用，但不保证在其他UNIX系统上都可用。

#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

int main()
{
	signal(SIGCHLD, SIG_IGN);
	if (fork() == 0)
    {
		//child
		printf("child is running, child dead: %d\n", getpid());
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}

此时子进程在终止时会自动被清理掉，不会产生僵尸进程，也不会通知父进程。

-元清-

关注

12
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Linux操作系统】：Linux进程信号

实际上当用户按 Ctrl+C 时，这个键盘输入会产生一个硬中断，被操作系统获取并解释成信号（Ctrl+C被解释成2号信号），然后操作系统将2号信号发送给目标前台进程，当前台进程收到2号信号后就会退出。我们可以使用 signal 函数对2号信号进行捕捉，证明当我们按 Ctrl+C时进程确实是收到了2号信号。signal 函数的详情如下：
复制链接

扫一扫