Linux进程信号【信号处理】_linux 信号处理，整理几个重要的大数据开发知识

2401_84170391

于 2024-04-17 07:03:32 发布

阅读量868

点赞数 17

分类专栏： 2024年程序员学习文章标签： linux 信号处理大数据

本文链接：https://blog.csdn.net/2401_84170391/article/details/137852598

版权

2024年程序员学习专栏收录该内容

68 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文

这种情况就比较麻烦了，用户自定义的动作位于 **用户态** 中，也就是说，需要先切回 **用户态**，把动作完成了，重新坠入 **内核态**，最后才能带着进程的上下文相关数据，返回 **用户态**

在 **内核态** 中，也可以直接执行自定义动作，为什么还要切回 **用户态** 执行自定义动作？

因为在 **内核态** 可以访问操作系统的代码和数据，自定义动作可能干出危害操作系统的事
在 **用户态** 中可以减少影响，并且可以做到溯源

为什么不在执行完 自定义动作 直接后返回进程？

因为自定义动作和待返回的进程属于不同的堆栈，是无法返回的
并且进程的上下文数据还在内核态中，所以需要先坠入内核态，才能正确返回用户态

注意： 用户自定义的动作，需要先切换至 **用户态** 中执行，执行结束后，还需要坠入 **内核态**

通过一张图快速记录信号的处理过程

图片来源：Linux进程信号

3、信号的捕捉

接下来谈谈信号是如何被捕捉的

3.1、内核如何实现信号的捕捉？

如果信号的执行动作为 用户自定义动作，当信号递达时调用 用户自定义动作，这一动作称为 信号捕捉

用户自定义动作是位于用户空间中的

当 **内核态** 中任务完成，准备返回 **用户态** 时，检测到信号递达，并且此时为 用户自定义动作，需要先切入 **用户态** ，完成 用户自定义动作 的执行；因为 用户自定义动作 和 待返回的函数 属于不同的堆栈空间，它们之间也不存在 调用与被调用 的关系，是两个 独立的执行流，需要先坠入 **内核态** （通过 sigreturn() 坠入），再返回 **用户态** （通过 sys_sigreturn() 返回）

上述过程可以总结为下图：

3.2、sigaction

sigaction 也可以 用户自定义动作，比 signal 功能更丰富

#include <signal.h>

int sigaction(int signum, const struct sigaction \*act,
                     struct sigaction \*oldact);

struct sigaction 
{
	void     (\*sa_handler)(int);	//自定义动作
	void     (\*sa_sigaction)(int, siginfo_t \*, void \*);	//实时信号相关，不用管
	sigset_t   sa_mask;	//待屏蔽的信号集
	int        sa_flags;	//一些选项，一般设为 0
	void     (\*sa_restorer)(void);	//实时信号相关，不用管
};

返回值：成功返回 0，失败返回 -1 并将错误码设置

参数1：待操作的信号

参数2：sigaction 结构体，具体成员如上所示

参数3：保存修改前进程的 sigaction 结构体信息

这个函数的主要看点是 sigaction 结构体

struct sigaction 
{
	void     (\*sa_handler)(int);	//自定义动作
	void     (\*sa_sigaction)(int, siginfo_t \*, void \*);	//实时信号相关，不用管
	sigset_t   sa_mask;	//待屏蔽的信号集
	int        sa_flags;	//一些选项，一般设为 0
	void     (\*sa_restorer)(void);	//实时信号相关，不用管
};

其中部分字段不需要管，因为那些是与 实时信号 相关的，我们这里不讨论

重点可以看看 sa_mask 字段

sa_mask：当信号在执行用户自定义动作时，可以将部分信号进行屏蔽，直到用户自定义动作执行完成

也就是说，我们可以提前设置一批 待阻塞 的 屏蔽信号集，当执行 signum 中的 用户自定义动作 时，这些 屏蔽信号集 中的信号将会被屏蔽（避免干扰 用户自定义动作 的执行），直到 用户自定义动作 执行完成

可以简单用一下 sigaction 函数

#include <iostream>
#include <cassert>
#include <cstring>
#include <signal.h>
#include <unistd.h>

using namespace std;

static void DisplayPending(const sigset_t pending)
{
    // 打印 pending 表
    cout << "当前进程的 pending 表为: ";
    int i = 1;
    while (i < 32)
    {
        if (sigismember(&pending, i))
            cout << "1";
        else
            cout << "0";

        i++;
    }
    cout << endl;
}

static void handler(int signo)
{
    cout << signo << " 号信号确实递达了" << endl;
    // 最终不退出进程

    int n = 10;
    while (n--)
    {
        // 获取进程的 未决信号集
        sigset_t pending;
        sigemptyset(&pending);

        int ret = sigpending(&pending);
        assert(ret == 0);
        (void)ret; // 欺骗编译器，避免 release 模式中出错

        DisplayPending(pending);
        sleep(1);
    }
}

int main()
{
    cout << "当前进程: " << getpid() << endl;
    
    //使用 sigaction 函数
    struct sigaction act, oldact;

    //初始化结构体
    memset(&act, 0, sizeof(act));
    memset(&oldact, 0, sizeof(oldact));

    //初始化 自定义动作
    act.sa_handler = handler;

    //初始化 屏蔽信号集
    sigaddset(&act.sa_mask, 3);
    sigaddset(&act.sa_mask, 4);
    sigaddset(&act.sa_mask, 5);

    //给 2号 信号注册自定义动作
    sigaction(2, &act, &oldact);

    // 死循环
    while (true);

    return 0;
}

当 2 号信号的循环结束（10 秒），3、4、5 信号的阻塞状态解除，立即被递达，进程就被干掉了

注意： 屏蔽信号集 sa_mask 中已屏蔽的信号，在用户自定义动作执行完成后，会自动解除阻塞状态

4、信号部分小结

截至目前，信号处理的所有过程已经全部学习完毕了

信号产生阶段：有四种产生方式，包括键盘键入、系统调用、软件条件、硬件异常

信号保存阶段：内核中存在三张表，blcok 表、pending 表以及 handler 表，信号在产生之后，存储在 pending 表中

信号处理阶段：信号在 **内核态** 切换回 **用户态** 时，才会被处理

===== 补充 =====

下面是一些补充知识

5、可重入函数

可以被重复进入的函数称为 可重入函数

比如单链表头插的场景中，节点 node1 还未完成插入时，node2 也进行了头插，最终导致节点 node2 丢失，造成 内存泄漏

导致 内存泄漏 的罪魁祸首：对于 node1 和 node2 来说，操作的单链表是同一个，同时进行并发访问（重入）会出现问题的，因为此时的单链表是临界资源

我们学过的函数中，90% 都是 不可重入的

函数是否可重入是一个特性，而非缺点，需要正确看待

不可重入的条件：

调用了内存管理相关函数
调用了标准 I/O 库函数，因为其中很多实现都以不可重入的方式使用数据结构

6、volatile

volatile 关键字可以避免 编译器 的优化，保证内存的 可见性

比如在下面这个例子中

借助全局变量 falg 设计一个死循环的场景，在此之前将 2 号信号进行自定义动作捕捉，具体动作为：将 flag 改为 1，可以终止 main 函数中的循环体

#include <stdio.h>
#include <signal.h>

int flag = 0;   // 一开始为假

void handler(int signo)
{
    printf("%d号信号已经成功发出了\n", signo);
    flag = 1;
}

int main()
{
    signal(2, handler);

    while(!flag);   // 故意不写 while 的代码块 { }

    printf("进程已退出\n");

    return 0;
}

初步结果符合预期

初步结果符合预期，2 号信号发出后，循环结束，程序正常退出

这段代码能符合我们预期般的正确运行是因为 当前编译器默认的优化级别很低，没有出现意外情况

通过指令查询 gcc 优化级别的相关信息

man gcc
: /O1

其中数字越大，优化级别越高，理论上编译出来的程序性能会更好

事实真的如此吗？

让我们重新编译上面的程序，并指定优化级别为 O1

gcc mySignal mySignal.c -O1

编译成功后，再次运行程序

此时得到了不一样的结果：2 号信号发出后，对于 falg 变量的修改似乎失效了

将优化级别设为更高是一样的结果，如果设为 O0 则会符合预期般的运行，说明我们当前的编译器默认的优化级别是 O0

查看编译器的版本

gcc --version

当前版本为 gcc（GCC） 4.8.5 （不同版本编译器的默认优化级别可能略有不同）

那么我们这段代码哪个地方被优化了呢？

答案是 while 循环判断

首先要明白：

对于程序中的数据，需要先被 load 到 CPU 中的 **寄存器** 中
判断语句所需要的数据（比如 flag），在进行判断时，是从 **寄存器** 中拿取并判断
根据判断的结果，判断代码的下一步该如何执行（通过 PC 指针指向具体的代码执行语句）

所以程序在优化级别为 O0 或更低时，是这样执行的：

7、SIGCHLD 信号

在 进程控制 学习时期，我们明白了一个事实：父进程必须等待子进程退出并回收，并为其 “收尸”，避免变成 “僵尸进程” 占用系统资源、造成内存泄漏

那么 父进程是如何知道子进程退出了呢？

在之前的场景中，父进程要么就是设置为 阻塞式专心等待，要么就是 设置为 WNOHANG 非阻塞式等待，这两种方法都需要 父进程 主动去检测 子进程 的状态

如今学习了 进程信号 相关知识后，可以思考一下：子进程真的是安安静静的退出的吗？

答案当然不是，子进程在退出后，会给父进程发送 SIGCHLD 信号

可以通过 SIGCHLD 信号 通知 父进程，子进程 要退出了，这样可以解放 父进程，不必再去 主动检测 ，而是 子进程 要退出的时候才通知其来 “收尸”

SIGCHLD 信号比较特殊，默认动作 SIG_DEF 是 什么都不做

首先通过程序证明一下子进程会发出 SIGCHLD 信号

通过自定义捕捉，打印相关信息

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

void handler(int signo)
{
    printf("进程 %d 捕捉到了 %d 号信号\n", getpid(), signo);
}

int main()
{
    signal(SIGCHLD, handler);

    pid\_t id = fork();
    if(id == 0)
    {
        int n = 5;
        while(n)
            printf("子进程剩余生存时间: %d秒 [pid: %d ppid: %d]\n", n--, getpid(), getppid());
        
        // 子进程退出
        exit(-1);
    }

    waitpid(id, NULL, 0);
    return 0;
}

因此可以证明 SIGCHLD 是被子进程真实发出的，当然，我们可以自定义捕捉动作为 回收子进程，让父进程不再主动检测子进程的状态，可以自己忙自己的事

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

pid\_t id;   // 将子进程的id设为全局变量，方便对比

void handler(int signo)
{
    printf("进程 %d 捕捉到了 %d 号信号\n", getpid(), signo);

    // 这里的 -1 表示父进程等待时，只要是已经退出了的子进程，都可以进行回收
    pid\_t ret = waitpid(-1, NULL, 0);
    if(ret > 0)
        printf("父进程: %d 已经成功回收了 %d 号进程，之前的子进程是 %d\n", getpid(), ret, id);
}

int main()
{
    signal(SIGCHLD, handler);

    id = fork();
    if(id == 0)
    {
        int n = 5;
        while(n)
        {
            printf("子进程剩余生存时间: %d秒 [pid: %d ppid: %d]\n", n--, getpid(), getppid());
            sleep(1);
        }

        // 子进程退出
        exit(-1);
    }

    // 父进程很忙的话，可以去做自己的事
    while(1)
    {
        // TODO
        printf("父进程正在忙...\n");
        sleep(1);
    }

    return 0;
}

父进程和子进程各忙各的，子进程退出后会发信号通知父进程，并且能做到正确回收

那么这种方法就一定对吗？

答案是不一定，在只有一个子进程的场景中，这个代码没问题，但如果是涉及多个子进程回收时，这个代码就有问题了

根本原因：SIGCHLD 也是一个信号啊，它可能也会在 block 表和 pending 表中被置为 1，当多个子进程同时向父进程发出信号时，父进程只能先回收最快发出信号的子进程，并将随后发出信号的子进程 SIGCHLD 信号保存在 blcok 表中，除此之外，其他的子进程信号就丢失了，父进程处理完这两个信号后，就认为没有信号需要处理了，这就造成了内存泄漏

解决方案：自定义捕捉函数中，采取 while 循环式回收，有很多进程都需要回收没问题，排好队一个个来就好了，这样就可以确保多个子进程同时发出 SIGCHLD 信号时，可以做到一一回收

细节：多个子进程运行时，可能有的退了，有的没退，这会导致退了的子进程发出信号后，触发自定义捕捉函数中的循环等待机制，回收完已经退出了的子进程后，会阻塞式的等待还没有退出的子进程，如果子进程一直不退，就会一直被阻塞，所以我们需要把进程回收设为 WNOHANG 非阻塞式等待

正确的代码长这样：

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

void handler(int signo)
{
    printf("进程 %d 捕捉到了 %d 号信号\n", getpid(), signo);

    // 这里的 -1 表示父进程等待时，只要是已经退出了的子进程，都可以进行回收
    while (1)
    {
        pid_t ret = waitpid(-1, NULL, WNOHANG);
        if (ret > 0)
            printf("父进程: %d 已经成功回收了 %d 号进程\n", getpid(), ret);
        else
            break;
    }
    printf("子进程回收成功\n");
}

int main()
{
    signal(SIGCHLD, handler);

    // 创建10个子进程
    int n = 10;
    while (n--)
    {
        pid_t id = fork();

        if (id == 0)
        {
            int n = 5;
            while (n)
            {
                printf("子进程剩余生存时间: %d秒 [pid: %d ppid: %d]\n", n--, getpid(), getppid());
                sleep(1);
            }

            // 子进程退出
            exit(-1);
        }
    }

    // 父进程很忙的话，可以去做自己的事
    while (1)
    {
        // TODO
        printf("父进程正在忙...\n");
        sleep(1);
    }

    return 0;
}

其实还有一种更加优雅的子进程回收方案

由于 UNIX 历史原因，要想子进程不变成 僵尸进程，可以把 SIGCHLD 的处理动作设为 SIG_IGN 忽略，这里的忽略是个特例，只是父进程不对其进行处理，但只要设置之后，子进程在退出时，由 操作系统 对其负责，自动清理资源并进行回收，不会产生 僵尸进程

也就是说，直接在父进程中使用 signal(SIGCHLD, SIG_IGN) 就可以优雅的解决 子进程回收问题，父进程既不用等待，也不需要对信号做出处理

原理：在设置 SIGCHLD 信号的处理动作为忽略后，父进程的 PCB 中有关僵尸进程处理的标记位会被修改，子进程继承父进程的特性，子进程在退出时，操作系统检测到此标记位发生了改变，会直接把该子进程进行释放

SIGCHLD 的默认处理动作是忽略（什么都不做），而忽略动作是让操作系统帮忙回收，父进程不必关心

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）