Linux 信号捕捉与处理

麻辣韭菜

已于 2024-05-17 21:28:47 修改

阅读量772

点赞数 24

分类专栏： Linux初窥门径文章标签： linux 运维服务器

于 2024-05-17 21:28:14 首次发布

本文链接：https://blog.csdn.net/2301_77934192/article/details/138921825

版权

Linux初窥门径专栏收录该内容

24 篇文章 0 订阅

订阅专栏

💓博主CSDN主页:麻辣韭菜💓

⏩专栏分类：Linux知识分享⏪

🚚代码仓库:Linux代码练习🚚

🌹关注我🫵带你学习更多Linux知识
🔝

前言

信号产生到处理这是有一个过程的，从上篇信号保存我们知道了有一个handler表里面存放的是对信号处理的方法。

那什么时候调用这些方法？本篇就揭晓处理信号的时机。

1. 信号的处理时机

直接说结论：当我们用户从内核态返回到用户态时，进行信号的检测与处理。

那什么是用户态？什么又是内核态？

1.1用户态与内核态

用户态：我们写的代码被执行时，就是用户态。

内核态：执行系统代码时，就是内核态。

如何理解内核态？

我们之前所学的fork创建子进程。 open read witre close这些系统调用接口被执行时，进程就从用户态切换成了内核态。

在调用这些系统调用接口。其实有都有一条汇编指令：int 80 （用户态切换成内核态）

也就是说执行我们代码时，是会产生中断或者异常，当CPU在处理中断或异常时，会根据中断描述符表（Interrupt Descriptor Table, IDT）中的描述符的DPL来决定是否需要进行上下文切换。如果当前的Code Segment的DPL高于或等于IDT中描述符的DPL，那么CPU将不会切换到一个新的特权级别，否则会进行上下文切换。

回想之前的进程地址空间图，高地址的 3G 到 4G是内核空间，所以我们需要从新再谈地址空间，才能更好的理解用户状态的切换。

1.2再谈地址空间

每个进程都会有自己的地址空间和用户级页表，因为进程具有独立性。

从上图可以看到每个地址空间的3G到4G是内核空间。也就是说执行操作系统代码以及系统调用接口的代码和数据是在这一个区域。

那是不是每个进程都要有内核级的页表？

当然不用。内核级页表只有一份！！！

每一个进程在0到3GB 所看到的代码和数据是不一样的。内核级页表只有一份，就意味着3GB到4GB这段空间，所有进程看到的都是同样的代码和数据（OS）所以不管怎么切换进程这段空间的内容是不变的。

那进程又是如何被调度的？

不要忘了OS也是软件啊。并且还是一个死循环等待指令软件。

当然等待指令也是需要硬件的。时钟硬件 每格一段时间就会向cpu发送信息。OS这时就会知道，那个进程的时间片到了然后通过一系列系统调用函数 switch_to() 宏，以及底层的 context_switch() 函数。进行上下文切换。

1.3 信号处理过程

这里需要解释用户自定义为什么要回到用户模式执行处理方法。

有人就会说在第2步时，已经在内核态了可以执行信号处理的方法。为什么还要回到用户态？

因为OS对除了自己的系统调用对任何的代码都不相信，所以OS检测到是用户定义方法时。会切换状态。变成用户态，用户态执行信号处理。再次切换成内核态

那为什么还要返回到内核态？

因为进程的上下文还在内核态中，自定义函数栈帧和进程的栈帧不是同一个。拿什么返回上下文的数据？

上面的图有点复杂我们用简化的版图数学上的无穷符号

1. 4 内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。

如果用户程序注册了SIGQUIT信号的处理函数 sighandler。

当前正在执行main函数,这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。

内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler 和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn 再次进入内核态。

如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

2. sigaction

#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

功能

sigaction() 系统调用用于改变进程接收特定信号时采取的动作。

参数

signum: 指定信号的标识符，可以是任何有效的信号，除了 SIGKILL 和 SIGSTOP。
act: 如果非空，表示要安装的新信号动作，来源于 act。
oldact: 如果非空，表示先前的信号动作将被保存在 oldact 中。

结构体定义

struct sigaction {
    void     (*sa_handler)(int); // 传统信号处理函数
    void     (*sa_sigaction)(int, siginfo_t *, void *); // SA_SIGINFO 标志设置时使用的信号处理函数
    sigset_t   sa_mask; // 信号掩码，定义了信号处理函数执行时哪些信号应当被屏蔽
    int        sa_flags; // 信号处理标志
    void     (*sa_restorer)(void); // 已废弃，不应使用
};

注意事项

结构体中 sa_handler 和 sa_sigaction 不应同时被赋值，它们是互斥的。
sa_restorer 成员已废弃，POSIX 标准中没有指定该成员。
sa_flags 中设置 SA_SIGINFO 标志时，使用 sa_sigaction 成员，否则使用 sa_handler。

信号处理函数

sa_handler: 可以是 SIG_DFL（默认动作）、SIG_IGN（忽略信号）或者指向信号处理函数的指针。处理函数仅接收信号编号作为参数。
如果 sa_flags 包含 SA_SIGINFO，则 sa_sigaction 指定信号处理函数，该函数接收三个参数：信号编号、指向 siginfo_t 的指针（包含信号的详细信息），以及指向 ucontext_t 的指针（通常被转换为 void * 类型，包含了信号发生时的上下文信息）。

代码演示

#include <iostream>
#include <cstring>
#include <unistd.h>
#include <signal.h>
using namespace std;
void PrintPending()
{
    sigset_t set;
    sigpending(&set);
    for (int signo = 31; signo >= 1; signo--)
    {
        if (sigismember(&set, signo))
        {
            cout << "1";
        }
        else
            cout << "0";
    }
    cout << endl;
}

void handler(int signo)
{
    cout << " catch a  signal ,signal number: " << signo << endl;
    while (true)
    {
        PrintPending();
        sleep(1);
    }
}

int main()
{
    // 1.使用sigaction函数
    struct sigaction act, oact;
    // 1.1初始化 act oact。
    memset(&act, 0, sizeof(act));
    memset(&oact, 0, sizeof(oact));
    // 2.1 初始化 并设置信号屏蔽集
    sigemptyset(&act.sa_mask);
    sigaddset(&act.sa_mask, 1);
    sigaddset(&act.sa_mask, 3);
    sigaddset(&act.sa_mask, 4);
    // 3.自定义handler函数
    act.sa_handler = handler;
    //3.1 给2号信号注册自定义动作。
    sigaction(2, &act, &oact);
    while (true)
    {
        cout << "I am a process: " << getpid() << endl;
        sleep(1);
    }
    // 4. 发送信号
    return 0;
}

可以从运行结果来看，我们发送4号信号确实被阻塞了。但是未决表中有信信息。

3. 额外知识

掌握额外知识在后面线程章节中，能更好的理解线程。

3.1可重入函数

有没有一种可能两个进程同时执行容器 list 的插入函数 insert，当进程1开辟好空间时，刚好进程1的调度时间片到了切换成进程2。而进程2调度时间，刚好可以把insert这个函数执行完毕。然后进程1再次被调度执行insert。这时进程2的insert函数调用new开辟的空间就会出现内存泄漏。

当然大家也不用担心。

我们学过的99%的函数都是不可被重入。

那有没有需要重入的场景？

操作系统服务：操作系统提供的某些服务，如内存分配器，必须是可重入的，因为它们可能会被不同的进程或线程同时调用。

那什么样的函数可以重入？

不使用全局变量或静态变量：可重入函数不依赖于全局或静态变量来存储状态，因为这些变量可能被多个线程共享，从而导致数据竞争。

不执行I/O操作：I/O操作可能会涉及系统资源，如文件句柄，这些资源在多线程环境中可能会引起冲突。

不调用其他不可重入的函数：如果可重入函数调用了不可重入的函数，它自身也就不再是可重入的了。

不返回指向内部数据结构的指针：函数返回的指针不应该指向函数内部的局部变量或分配的内存，因为这些内存在函数返回后可能会被释放。

不产生副作用：可重入函数不应该改变程序的其他部分的状态，除了其返回值。

使用局部变量：所有需要的变量都应该在函数内部分配，通常是在栈上。

使用互斥锁或原子操作：如果必须访问共享资源，可重入函数应该使用互斥锁（mutexes）或原子操作来确保线程安全。

避免使用动态内存分配：虽然技术上可行，但动态内存分配（如使用malloc或new）可能会使函数不可重入，因为这些操作可能会依赖于全局或静态状态。

快速执行：可重入函数应该设计成执行时间尽可能短，以减少它被中断的可能性。

信号安全：如果函数设计用于响应信号（如在UNIX系统中），它应该是信号安全的，即它可以在信号处理的上下文中安全调用。

3.2 volatile

#include <iostream>
#include <cstring>
#include <unistd.h>
#include <signal.h>
using namespace std;
int n = 0;
void handler(int signo)
{
    cout << " catch a  signal ,signal number: " << signo << endl;
    n = 1;
}

int main()
{
    signal(2, handler);
    while (!n);
    cout << "process quit normal" << endl;
    return 0;
}

初步结果符合预期，2 号信号发出后，循环结束，程序正常退出

那是因为当前编译器默认的优化级别很低，没有出现意外情况

通过指令查询 g++优化级别的相关信息

man g++
: /O1

其中数字越大，优化级别越高，理论上编译出来的程序性能会更好

那我们再改成 -O1试试

g++ -o $@ $^ -g -O1 -std=c++11

编译成功运行得到下面的结果。

此时得到了不一样的结果：2 号信号发出后，对于 falg 变量的修改似乎失效了

从上面的实验的，我们知道编译肯定是优化了，不然为什么while循环一直不退出。

为什么优化了，就会出现 n 的值修改失效？

为了防止编译器过度优化，votatile 这个关键字就出现了。它的作用就是防止编译过度优化。

volatile int n = 0;

这时我们在编译

3.3 SIGCHLD 信号

在进程控制学习期间，我们知道父进程必须等待子进程的退出然后回收。以前没有信号的概念，那子进程退出后，会给父进程发信号吗？

当然会发信号子进程退出后会给父进程发送 SIGCHLD 信号

SIGCHLD 是普通信号的17号位

下面我们用一段代码证明

#include <iostream>
#include <cstring>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>
using namespace std;


void handler(int signo)
{
    cout << " catch a  signal ,signal number: " << signo << endl;
    
}


int main()
{
    signal(17,handler);
    for(int i = 0 ; i<10 ; i++)
    {
        pid_t pid = fork();
        if(pid == 0)
        {
            while(true)
            {
                cout << "I am a child process: " << getpid() << " ppid: " << getppid() << endl;
                sleep(1);
                break;
            }
            cout << " child quit !!! " << endl;
            exit(0);
        }
        sleep(1);

    }
    while (true)
    {
        cout << "I am father process: " << getpid() << endl;
        sleep(1);
    }

    return 0;
}

从面结果来看确实回收了子进程。但是这个代码有问题。不要忘了pending表的位图17只有一位。如果回收多个进程那么OS只会做一次信号处理，而其他的子进程没有回收就造成内存泄漏。那如何解决？

自定义捕捉函数中，采取 while 循环式回收，有很多进程都需要回收没问题，排好队一个个来就好了，这样就可以确保多个子进程同时发出 SIGCHLD 信号时，可以做到一一回收

#include <iostream>
#include <cstring>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>
using namespace std;


void handler(int signo)
{
    pid_t rid;
    while ((rid = waitpid(-1, nullptr, WNOHANG)) > 0)
    {
        cout << "I am proccess: " << getpid() << " catch a signo: " << signo << "child process quit: " << rid << endl;
    }
    
}


int main()
{
    signal(17,SIG_IGN);
    for(int i = 0 ; i<10 ; i++)
    {
        pid_t pid = fork();
        if(pid == 0)
        {
            while(true)
            {
                cout << "I am a child process: " << getpid() << " ppid: " << getppid() << endl;
                sleep(1);
                break;
            }
            cout << " child quit !!! " << endl;
            exit(0);
        }
        sleep(1);

    }
    while (true)
    {
        cout << "I am father process: " << getpid() << endl;
        sleep(1);
    }

    return 0;
}