【Linux学习笔记】一篇文章彻底搞定 “Linux进程信号“ ！

最新推荐文章于 2024-05-12 08:52:10 发布

笨笨胡小巴

最新推荐文章于 2024-05-12 08:52:10 发布

阅读量1k

点赞数 31

分类专栏： Linux 文章标签： linux 信号处理

本文链接：https://blog.csdn.net/qq_64446981/article/details/137932038

版权

Linux 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本节重点：

1. 掌握Linux信号的基本概念

2. 掌握信号产生的一般方式

3. 理解信号递达和阻塞的概念，原理。

4. 掌握信号捕捉的一般方式。

5. 重新了解可重入函数的概念。

6. 了解竞态条件的情景和处理方式

7. 了解SIGCHLD信号，重新编写信号处理函数的一般处理机制

一、掌握Linux信号的基本概念

1. 生活角度的信号

你在网上买了很多件商品，再等待不同商品快递的到来。但即便快递没有到来，你也知道快递来临时，你该怎么处理快递。也就是你能“识别快递”
当快递员到了你楼下，你也收到快递到来的通知，但是你正在打游戏，需5min之后才能去取快递。那么在这5min之内，你并没有下去去取快递，但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行，可以理解成“在合适的时候去取”。
在收到通知，再到你拿到快递期间，是有一个时间窗口的，在这段时间，你并没有拿到快递，但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”
当你时间合适，顺利拿到快递之后，就要开始处理快递了。而处理快递一般方式有三种：1. 执行默认动作（幸福的打开快递，使用商品）2. 执行自定义动作（快递是零食，你要送给你的女朋友）3. 忽略快递（快递拿上来之后，扔掉床头，继续开一把游戏）
快递到来的整个过程，对你来讲是异步的，你不能准确断定快递员什么时候给你打电话

总结一下：

但是我们在说进程啊，你怎么说到快递上去了呢？那我们回顾归本题

进程就是你，操作系统就是快递员，信号就是快递！！

⭐信号就是Linux系统提供的让用户(进程)给其他进程发送异步信息的一种方式！

⭐为什么要存在信号呢？？？系统要求进程要有随时响应外部信号的的能力，随后做出反应。

2. 技术应用角度的信号

用户输入命令，在Shell下启动一个前台进程。

用户按下Ctrl + C ,这个键盘输入产生一个硬件中断，被OS获取，解释成信号，发送给目标前台进程
前台进程因为收到信号，进而引起进程退出

3. 注意

Ctrl + C 产生的信号只能发给前台进程。一个命令后面加个&可以放到后台运行，这样Shell不必等待进程结束就可以接受新的命令，启动新的进程。
2. Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像 Ctrl-C 这种控制键产生的信号。
3. 前台进程在运行过程中用户随时可能按下 Ctrl-C 而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步 (Asynchronous)的。

4. 信号概念

信号是进程之间事件异步通知的一种方式，属于软中断。

5. 用kill -l命令可以察看系统定义的信号列表

每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定义 #define SIGINT 2 编号34以上的是实时信号,本章只讨论编号34以下的信号,不讨论实时信号。这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal

6. 信号处理常见方式概览

1. 忽略此信号。
2. 执行该信号的默认处理动作。
3. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉 (Catch)一个信号。

二、产生信号

1.kill命令

首先在后台执行死循环程序,然后用kill命令给它发SIGSEGV信号。

⭐4568是test进程的id。之所以要再次回车才显示 Segmentation fault ,是因为在4568进程终止掉之前已经回到了Shell提示符等待用户输入下一条命令,Shell不希望Segmentation fault信息和用户的输入交错在一起,所以等用户输入命令之后才显示。

⭐指定发送某种信号的kill命令可以有多种写法,上面的命令还可以写成 kill -SIGSEGV 4568 或 kill -11 4568 , 11是信号SIGSEGV的编号。以往遇到的段错误都是由非法内存访问产生的,而这个程序本身没错, 给它发SIGSEGV也能产生段错误。

接下来我们就来演示一下上面的信号处理的三种方式

makefile

testSig:handlerSignal.cc
	g++ -o $@ $^ -std=c++11
.PHONY:clean
clean:
	rm -f testSig

handlerSignal.cc

#include <iostream>
#include <unistd.h>
#include <sys/types.h>
using namespace std;

int main()
{
    while(true)
    {
        cout << "I an active..., pid: " << getpid() << endl;
        sleep(1);
    }
    return 0;
}

然后我们来运行程序：

可是我们要怎么产生信号呢？kill命令

kill -2 进程id，进程自己终止，这个就是属于处理信号的默认动作

kill -9 进程id，杀掉进程，这个也属于处理信号的默认动作，那自定义信号

直接使用起来

#include <iostream>
#include <unistd.h>
#include <sys/types.h>
#include <signal.h>

using namespace std;

void handler(int signo)
{
    cout << "get a signal, number is: " << signo << endl;
    exit(100);
}

int main()
{   
    signal(SIGINT, handler); //handler(SIGINT)
    // 收到哪个信号,就会将这个信号作为参数传递给handler
    // signal调用完了,handler方法会被立即执行吗?不是,设置对象信号的处理方式
    // 未来我们收到对应的信号才执行handler方法
    // 未来进程永远没有收到SIGINT信号呢?handler永远不会被调用

    while(true)
    {
        cout << "I an active..., pid: " << getpid() << endl;
        sleep(1);
    }
    return 0;
}

运行结果

查看退出码

最后一种忽略这个信号呢？

此时使用信号2就无法影响到该进程了，产生信号还有一种方式：键盘产生信号

2.键盘产生信号

SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump,现在我们来验证一下。

⭐ctrl + c：为什么？OS会将其解释为2号信号（SIGINT），并向目标进程发送，进程收到以后就可以进行响应

⭐也可以使用ctrl + \，OS会将其解释为3号信号（SIGQUIT），并向目标进程发送，进程收到以后就可以进行响应

3.系统调用

我们还可以通过系统调用向目标进程发送信号

kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。所以我们就可以自己来模拟一个kill指令

makefile文件

testkill:MyKill.cc
	g++ -o $@ $^ -std=c++11
.PHONY:clean
clean:
	rm -f testkill

MyKill.cc

#include <iostream>
#include <unistd.h>
#include <sys/types.h>
#include <signal.h>
#include <errno.h>
#include <cstring>

using namespace std;

// mykill -9 pid
int main(int argc, char* argv[])
{
    if(argc != 3)
    {
        cout << "Usage: " << argv[0] << " -signumber pid" << endl;
        return 1;
    }

    int signumber = stoi(argv[1] + 1); //拿到信号
    int pid = stoi(argv[2]); //拿到进程的pid

    int n = kill(pid, signumber);
    if(n < 0)
        cout << "kill error, " << strerror(errno) << endl;
    return 0;
}

运行结果：

除了上面的系统调用kill：对任意进程发送任意的信号，我们还存在一个系统调用raise：谁调用我，就给谁发送任意的信号，raise函数可以给当前进程发送指定的信号(自己给自己发信号)。

#include <signal.h>
int kill(pid_t pid, int signo);
int raise(int signo);
这两个函数都是成功返回0,错误返回-1。

所以我们就可以直接上手代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

// 写一个计数器,达到条件发送信号9终止
int mian()
{
    int cnt = 0;
    while(true)
    {
        cout << "cnt: " << cnt++ << endl;
        sleep(1);
        if(cnt == 5)
        {
            cout << "send 9 to caller" << endl;
            raise(9);
        }
    }
    return 0;
}

我们也可以发送SIGSTOP信号让进程暂停，此时进程并没有退出哦，进程还是存在的。

我们还有一个系统调用abort：终止进程，对自己发送指定的信号（6 SIGABRT），abort函数使当前进程接收到信号而异常终止。

#include <stdlib.h>
void abort(void);
就像exit函数一样,abort函数总是会成功的,所以没有返回值。

对于这么多个信号，大部分信号的默认行为都是终止自己，我们可以通过man 7 signal来查看。

4.软件条件

之前我们在提管道的时候有一种情况，管道的读端不读了，并且还把我们的读端关闭了，此时写端再写数据就没有任何意义了，所以操作系统就认为此时管道的写端条件不具备了，就终止了写入进程，发送SIGPIPE而被终止。所以SIGPIPE是一种由软件条件产生的信号，本节主要介绍alarm函数和SIGALRM信号。

#include <unistd.h>
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 
该信号的默认处理动作是终止当前进程。

例 alarm

这个程序的作用是1秒钟之内不停地数数，1秒钟到了就被SIGALRM信号终止。数数好像有点少，我们来改进一下程序。

此时我们就发现数数的次数变大了很多，这是因为我们刚刚的代码在一直输出cout语句，Linux一下一切皆文件，cout的本质是向显示器写数据，显示器是外设，所以数会比较小，况且此时我们还是使用的云服务器，还要受网络影响，而修改的代码仅有一次输出，数数的过程是纯内存级操作，所以数比较大，可以得出一个结论：IO其实很慢。

我们再回过头来看一下alarm的返回值

这个函数的返回值是0或者是以前设定的闹钟时间还余下的秒数。打个比方,某人要小睡一觉,设定闹钟为30分钟之后响,20分钟后被人吵醒了,还想多睡一会儿,于是重新设定闹钟为15分钟之后响,“以前设定的闹钟时间还余下的时间”就是10分钟。如果seconds值为0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数（自己验证一下？）

void handler(int sig)
{
    cout << "get a signal number: " << sig << endl;
}
int main()
{
    // 发送SIGALRM信号 - Term 终止进程
    signal(SIGALRM, handler);
    // 设定一个闹钟
    // 闹钟只会响一次
    alarm(5);
    
    while(true)
    {
        sleep(1);
        cout << "..." << endl;
    }
    return 0;
}

运行结果：

如果我们想要多次响应呢？我们可以在闹钟响了之后再捕捉信号的地方再设置一个闹钟。

那闹钟如果提前响应了呢？新设置的闹钟的返回值就是以前设定的闹钟时间还余下的秒数。

我们再来看看alarm(0)的含义。

后续闹钟不再响应，此时alarm(0)可以取消闹钟。我们再来看下面的代码

⭐闹钟只会响应一次，只会执行最小的闹钟，程序便终止了

那为什么我们要将这个闹钟信号称之为软件条件呢？？？

说我们的管道，它是一个文件，而我们的软件本质是一个可执行程序，管道文件虽然不是可执行程序，但它作为软件系统中的一种重要组件和通信机制，可以影响到软件操作，那闹钟凭什么也算软件条件呢？闹钟函数本质是一个系统调用，所以本质上闹钟的设置是在操作系统内部设定的。那如果我们创建多个闹钟，那操作系统中必然存在很多闹钟，那么操作系统作为软硬件资源的管理者，所以操作系统必须对这些闹钟进行管理：先描述，再管理

那么此时闹钟就是一个数据结构，当闹钟设定的时候到了，导致进程接收到一个信号。这个信号可能会改变进程的执行路径，比如通过信号处理程序来中断当前的操作或执行特定的任务。因此，闹钟信号是触发进程行为变化的一个条件。虽然闹钟的设置是在操作系统内部完成的，但它是通过软件（通常是应用程序或库）的系统调用来实现的。我们可以将闹钟信号视为一种软件条件，它是软件与操作系统交互的一个例子，用于控制和管理软件的执行流程。

5. 硬件异常产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。

我们来看看是哪一个信号出现了导致进程被终止

怎么证明进程确实收到了8号信号呢？信号捕捉！

再比如当前进程访问了非法内存地址，MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

我们来看看是哪一个信号出现了导致进程被终止

怎么证明进程确实收到了11号信号呢？信号捕捉！

由此可以确认，我们在C/C++当中除零，内存越界等异常，在系统层面上，是被当成信号处理的。

6.信号产生加深理解

下面我们就来对上面的关于信号产生的各种情况的理解

kill命令

kill指令是一个可执行程序，使用c/c++实现，底层是封装了kill系统调用

键盘产生信号

什么叫做解释成为信号，什么叫做发送给进程? ? ?

⭐解释成信号本质是修改进程中存储信号的数据结构位图对应得比特位，将其比特位设置1，表示此时已经发送信号完毕！！！

⭐无论信号产生的方式有多少种，最终都是OS动手向进程写入信号的！！！

系统调用

本质上也是让操作系统去写入的！！！

软件条件

当你所设置的闹钟时间到了，此时操作系统就会向进程的信号数据结构位图将指定信号的位置的比特位置为1，表示向该进程发送信号！！！包括我们平常向一个错误的管道写入信息，此时调用的使write系统调用，此时操作系统就知道哪个进程调用的write系统调用，此时操作系统就会向这个进程发送信号。

硬件异常

此时为什么是硬件异常就很好理解了，本质上都是硬件在计算的时候，出现了异常时候，操作系统检测到就会向进程发送信号，从而导致进程被终止。

7.Core Dump的理解

首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误, 事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug（事后调试）。
一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的, 因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024
ulimit命令改变了Shell进程的Resource Limit，test进程的PCB由Shell进程复制而来,所以也具有和Shell进程相同的Resource Limit值，这样就可以产生Core Dump了。

我们上面提到可以用man -7 signal来查看信号的行为，我们前面所提Core和Term都是用来终止进程的，现在我们具体来分析一下他们有什么区别，先来学英语单词

那我们首先来一个行为为Core的信号

我们直接此时确实发现了出现了异常，可是我们没有见到一个进程终止和我们的core有啥关系呀！因为云服务器默认core文件是被关闭的。如何验证了，我们可以强制打开这个core文件，如何打开呢？

首先我们要查看当前shell会话中所有资源限制的设置

core file size 默认大小为0，表示进程异常退出，不形成核心文件，们可以使用命令设置核心文件大小的上限，此时就相当于打开了Linux的core dump(核心转储)的功能，此时就可以将代码执行情况保存到core文件。

此时我们再运行上面的程序

紧接着我们换到centos平台下观察结果

现象观察到了，那现在具体理解core文件呢？

为了方便观察到现象，我们修改一下代码

makefile

testSig:testSig.cc
	g++ -o $@ $^ -std=c++11 -g
.PHONY:clean
clean:
	rm -f testSig

testSig.cc

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

int main()
{
    cout << "run begin..." << endl;
    int a = 10;
    a /= 0; //SIGFPE -> Core
    cout << "run end..." << endl;
    while(true) sleep(1);
    return 0;
}

输出的结果我们知道了，core文件是帮助我们调式的，怎么协助呢？使用 core-file core 加载core文件，就能帮我们定位到出现异常的地方。

这种调式方法我们称为事后调式法，在程序崩溃后，使用核心转储文件（core dump file），然后再调式的时候打开core文件，快速定位到出现异常的地方。问题来了，为什么云服务器默认将我们的核心转储功能关闭呢？为什么将core文件大小的默认上限设置为0呢？核心转储文件可能会非常大，如果多次运行一个异常代码，centosxtxia就会一直生成核心转储文件，核心转储功能一直运行，一直往磁盘写入，可能会迅速耗尽用户的磁盘。

对于ubuntu，它就优化了，它将新生成的核心转储文件覆盖旧的文件，而不是创建新的、具有唯一名称的文件，即便是我们忘记关闭核心转储功能或者是多次运行一个异常代码，不会因为过多的这些文件而耗尽磁盘空间，但是为了防止发送，云服务器还是禁止了这个核心转储的功能。

⭐总结：当一个进程接收到一个信号，并且这个信号的默认行为是Core，此时需要打开Linux的核心转储功能以使程序异常终止时能生成 core 文件，操作系统会负责将进程核心数据（与调式有关）保存到core文件，保存这些信息的目的是为了能够在后续的分析中调试进程崩溃的原因。通过检查core文件，可以了解进程在崩溃时的状态，从而帮助诊断问题。

我们之前在进程收到异常退出的时候，低七位表示的是退出时收到的异常信号，同时对与该信号的默认行为时Core还是Term呢？如果时Core，你是否需要核心转储呢？如果该位为1，则该进程已经发生了核心转储；该位为0，表示不发生核心转储，所以下面我们就用代码来演示一下进程异常退出的相关信息。

int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        sleep(2);
        int a = 10;
        a /= 0; // 故意异常，收到SIGFPE -> Core
        exit(0);// 退出码设置为0
    }

    //father
    int status;
    pid_t rid = waitpid(id,&status,0);
    if(rid > 0) //等待成功
    {
        cout << "exit code: " << ((status>>8) & 0xFF) << endl; 
        cout << "exit signal: " << (status & 0x7F) << endl;
        cout << "core dump: " << ((status>>7) & 0x1) << endl;
    }
    return 0;
}

如果我们关闭core dump的核心功能呢？关闭核心转储我们只需要将core文件的上限大小修改成0即可

可以看到 core dump标志位被改为了0。

⭐总结：corm dump标志位表示是否发生了核心存储功能，是否发生取决于系统有没有开启核心存储功能，已经进程收到的信号的默认行为是否是core.

三、发送信号

1.信号其他相关常见概念

实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态,称为信号未决(Pending)。
进程可以选择阻塞 (Block )某个信号。
被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

⭐总结一下：忽略就是已读不回，阻塞是根本看不见

注意：阻塞一个信号，和是否收到了指定信号没有关系，我可以在收到信号之前就可以对你这个信号进行阻塞。

2. 在内核中的表示

信号在内核中的表示示意图

每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。

有了这张图，也就证明了信号没有发生的时候，我么就知道信号到来时的处理动作，因为我们具有收到该信号的处理方法表。OS->发送信号->OS向目标进程写入信号，然后进程就知道怎么处理信号了，接下来我们就要来学习一下三张表匹配的操作和系统调用。

3. sigset_t

从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

4. 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的

#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember（const sigset_t *set, int signo);

函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

⭐sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
返回值:若成功则为0,若出错则为-1

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。

⭐sigpending

#include <signal.h>
sigpending
读取当前进程的未决信号集,通过set参数传出。
调用成功则返回0,出错则返回-1。

下面用刚学的几个函数做个场景：

1.屏蔽2号信号

2.获取进程的pending位图

3.打印所有的pending位图中的信号

4.未来我们给目标进程发送2号信号---屏蔽2号信号-- 2号信号不会被递达-- 2号信号会一直在pending位图中

void PrintSig(sigset_t& pending)
{
    // 我们这里不能直接打印pending
    // 它是一个结构体,不能打印
    //穷举所有信号
    cout << "Pending bitmap: ";
    for(int signo = 31; signo > 0; signo--)
    {
        if(sigismember(&pending, signo))
        {
            cout << "1";
        }
        else
        {
            cout << "0";
        }
    }
    cout << endl;
}

int main()
{
    //1.屏蔽2号信号
    sigset_t block, oblock;
    sigemptyset(&block);//屏蔽信号集清空
    sigemptyset(&oblock);//屏蔽信号集清空
    sigaddset(&block,2);//把2号信号添加到屏蔽信号
    // 目前根本就没有设置当前进程的PCB
    // 1.1 开始屏蔽2号信号，其实就是设置进入内核中
    int n = sigprocmask(SIG_SETMASK, &block, &oblock);
    assert(n == 0);

    cout << "block 2 signal success" << endl;

    while(true)
    {
        //2.获取pending位图
        sigset_t pending;
        sigemptyset(&pending);
        n = sigpending(&pending);//获取pending位图
        assert(n == 0);

        //3.打印所有的pending位图中的信号
        PrintSig(pending);

        sleep(1);
    }
    return 0;
}

我们来运行一下：

此时就有一个新奇的想法，如果我们将进程的block位图设置成全部都阻塞，那么此时进程除了自己退出，任何信号都干不掉自己，称为金刚不坏的进程。

我们来看看运行结果：

此时我们看到我们的进程还是被杀掉了，我们发现我们的进程的9号信号设置了，但是没有屏蔽成功，证明9号信号无法被屏蔽，所以金刚不坏的进程无法存在，然后我们再接着运行

同时19号信号也无法被屏蔽，同时我们屏蔽18号信号，此时会对19，20，21和22解除屏蔽。

如果我们还想要看到pending 2号信号由1变会0，并且看到2号信号递达的过程

void PrintSig(sigset_t& pending)
{
    // 我们这里不能直接打印pending
    // 它是一个结构体,不能打印
    //穷举所有信号
    cout << "Pending bitmap: ";
    for(int signo = 31; signo > 0; signo--)
    {
        if(sigismember(&pending, signo))
        {
            cout << "1";
        }
        else
        {
            cout << "0";
        }
    }
    cout << endl;
}

int main()
{
    

    //1.屏蔽2号信号
    sigset_t block, oblock;
    sigemptyset(&block);//屏蔽信号集清空
    sigemptyset(&oblock);//屏蔽信号集清空

    //0.for test: 如果我们屏蔽了所以信号呢？进程不会退，杀不掉
    //for(int signo = 1; signo <= 31; signo++)
        //sigaddset(&block,signo);//把所有信号添加到屏蔽信号
    // 目前根本就没有设置当前进程的PCB
    sigaddset(&block,2);
    // 1.1 开始屏蔽所有信号，其实就是设置进入内核中
    int n = sigprocmask(SIG_SETMASK, &block, &oblock);
    assert(n == 0);

    cout << "block 2 signal success" << endl;
    int cnt = 0;
    while(true)
    {
        //2.获取pending位图
        sigset_t pending;
        sigemptyset(&pending);
        n = sigpending(&pending);//获取pending位图
        assert(n == 0);

        //3.打印所有的pending位图中的信号
        PrintSig(pending);
        cnt++;

        //看到pending 2号信号 由1变会0，并且看到2号信号递达的过程
        //4.解除对2号信号的屏蔽
        if(cnt == 5)
        {
            cout << "成功解除对2号信号的屏蔽" << endl;
            //2号信号会被立即递达，并执行默认动作
            n = sigprocmask(SIG_UNBLOCK, &block, &oblock);
            assert(n == 0);
        }
        sleep(1);
    }
 
    return 0;
}

我们来运行一下：

此时进程就从阻塞状态中走出来，进行递达，而2号信号的默认行为是终止进程，上面的运行结果符合预期。但是我们上面的程序没有看到pengding位图中由1变成0的现象啊，所以我们对2号信号进行自定义捕捉，不让进行收到2号信号终止进程。

⭐总结：递达信号的时候，就一定会把对应pending位图清零

那是先清零和递达的顺序是怎么样的呢？谁先谁后呢？

⭐总结：先清零，后递达

四、信号处理

1.捕捉信号

2.内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。当前正在执行 main函数,这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的main函数之前检查到有信号 SIGQUIT递达。内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler 和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复 main函数的上下文继续执行了。

⭐如何理解系统调用接口？

⭐操作系统是如何正常运行的呢？

捕捉信号还有其他方式吗? signal? ?

3. sigaction

#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo 是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:
将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

void handler(int signo)
{
    cout << "signal: " << signo << endl;
}

int main()
{
    struct sigaction act, oact;
    act.sa_handler = handler;
    act.sa_flags = 0;
    sigemptyset(&act.sa_mask);//

    sigaction(2,&act,&oact);//对2号信号进行捕捉

    while(true)
    {
        sleep(1);
    }
    return 0;
}

此时我们就成功对2号信号进行了自定义捕捉。

void Print(sigset_t pending)
{
    cout << "curr process pending: ";
    for(int sig = 31; sig > 0; sig--)
    {
        if(sigismember(&pending, sig))
            cout << "1 ";
        else
            cout << "0 ";
    }
    cout << endl;
}

void handler(int signo)
{
    cout << "signal: " << signo << endl;
    // 不断获取当前进程的pending信号集合并打印
    sigset_t pending;
    sigisemptyset(&pending);
    while(true)
    {
        sigpending(&pending);
        Print(pending);
    }
}

int main()
{
    struct sigaction act, oact;
    act.sa_handler = handler;
    act.sa_flags = 0;
    sigemptyset(&act.sa_mask);//

    sigaction(2,&act,&oact);//对2号信号进行捕捉

    while(true)
    {
        sleep(1);
    }
    return 0;
}

当我们第一次发生2号信号，此时信号已经递达，但是一直再输出pending位图，此时信号递达并处理，所以是0，当再次发生的时候，2号信号就会屏蔽，不会递达。

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,本章不详细解释这两个字段,有兴趣的同学可以在了解一下。

4.可重入函数

main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从 sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之, 如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱?

如果一个函数符合以下条件之一则是不可重入的:

调用了malloc或free,因为malloc也是用全局链表来管理堆的。
调用了标准I/O库函数。I/O库的很多实现都以不可重入的方式使用全局数据结构。

5.volatile关键字

#include <stdio.h>
#include <signal.h>

int g_flag = 0;//全局变量

void changeflag(int signo)
{
    printf("g_flag -> 1\n");
    g_flag = 1;
}

int main()
{
    signal(2, changeflag);

    while(!g_flag);//故意写成这个样子,why???
    // 编译器默认会对我们的代码进行自动优化!!!
    // 编译器发现在main函数内没有对g_flag进行修改，存放在寄存器
    // 会出现意外的结果
    printf("process quit normal!\n");

    return 0;
}

我们来编译运行一下：

但是我们也没有发现什么问题啊？这是因为我们上面使用gcc编译器的指令形式不会做出优化，如果我们要gcc对我们的代码进行优化，我们就使用gcc test.c -O1

为什么呢？我们来解释一下：

volatile 作用：保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行操作

但是如果我们在while里面写了代码，即使我们没有带入volatile，那么编译器也不会优化。

6.SIGCHLD信号

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

void handler(int signo)
{
    cout << "child quit, father get a signal: "<< signo << endl;
}

int main()
{
    signal(SIGCHLD, handler);//自定义捕捉
    pid_t id = fork();
    if(id == 0)
    {
        //child
        int cnt = 5;
        while(cnt--)
        {
            cout << "I am child process: " << getpid() << endl;
            sleep(1);
        }
        cout << "child peocess died" << endl;
        exit(0);//子进程退出
    }
    while(true)
    {
        sleep(1);
    }
}

我们来查看一下运行结果：

此时我们确实看到了子进程在终止的时候给父进程发送了17号信号。之前我们回收等待子进程父进程有两种方式

waitpid/wait阻塞等
waitpid/wait非阻塞轮询等待子进程

无论是上面那种方式，都是父进程主动等待，既然我们能在信号里面捕捉到子进程退出的信号，那我父进程可不可以对子进程进行回收放在信号处理函数中！这样我们就大大减少了父进程的压力。

#include <iostream>
#include <signal.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

using namespace std;

void ClearUpChild(int signo)
{
    if(signo == SIGCHLD)
    {
        pid_t rid = waitpid(-1, nullptr, 0);
        if(rid > 0)
        {
            cout << "wait child success: " << rid << endl;
        }
    }
    cout << "wait sub process done..." << endl;
}

int main()
{
    signal(SIGCHLD, ClearUpChild);//自定义捕捉
    pid_t id = fork();
    if(id == 0)
    {
        //child
        int cnt = 5;
        while(cnt--)
        {
            cout << "I am child process: " << getpid() << endl;
            sleep(1);
        }
        cout << "child peocess died" << endl;
        exit(0);//子进程退出
    }
    while(true)
    {
        sleep(1);
    }
}

此时-1代表当前存在的任意一个子进程，我们程序运行完也能看到子进程被回收了，但是上面的代码也有问题，如果我们有多个子进程呢？此时就会发送多个信号，而信号不是立即处理的，而信号的存储是用位图来实现的，此时pending位图17号只记录一次，此时就只会回收一个子进程，我们来创建一百个子进程看看现象：

因为此时还有很多信号还没来的及处理，就又收到另一个进程的信号，此时位图只记录一次，导致只会执行几次回收子进程，所以我们需要修改程序。

此时就能保证所有进程退出，但是如果我们想让部分子进程退出呢？比如50个子进程，25个退出，25个保留，那么此时第二十六个子进程会一直等待回收，但是他不想退出，这样就导致我们一直回不到主进程了。

进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
请编写一个程序完成以下功能:父进程fork出子进程,子进程调用exit(2)终止,父进程自定义SIGCHLD信号的处理函数, 在其中调用wait获得子进程的退出状态并打印。
事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。

signal(SIGCHLD,SIG_IGN);

我们之前的子进程在回收的时候，我们没有使用信号，此时信号处理就是默认的行为忽略，但是此时子进程出现了僵尸，可是这里自定义位忽略，为什么又不会出现僵尸呢？其实这两种是有区别的，官方手册对17号默认处理的方式是SIG_DFL，此时它的默认行为是空的default，而SIG_IGN的行为才是真正忽略。

笨笨胡小巴

关注

31
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
【Linux学习笔记】一篇文章彻底搞定 “Linux进程信号“ ！

每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定义 #define SIGINT 2 编号34以上的是实时信号,本章只讨论编号34以下的信号,不讨论实时信号。这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal。
复制链接

扫一扫