Linux---进程信号

最新推荐文章于 2024-09-12 20:58:18 发布

竹下为生

最新推荐文章于 2024-09-12 20:58:18 发布

阅读量900

点赞数 20

分类专栏： Linux 文章标签： linux c++ 算法

本文链接：https://blog.csdn.net/V_zjs/article/details/136286855

版权

Linux 专栏收录该内容

27 篇文章 1 订阅

订阅专栏

一、信号的概念

信号是一种向目标进程发送通知消息的机制

信号的特性(可以结合红绿灯、防空警报等生活样例来理解)

1、在信号没有出现之前，我们就已经知道如何去处理信号，即我们认识信号

2、信号是异步产生的，即我们不知道它具体何时产生

3、当信号产生时，我们可以对它暂时忽略不做处理(比如我们外卖到了，但是你正在和朋友开黑，就会将外卖暂时搁置)

4、由于我们有时不会立即去执行信号，所以我们需要能储存信号

信号列表如下

一些补充的知识

二、信号的产生

1、通过键盘进行信号的产生

解释如下

该系统调用接口可以自定义捕捉信号的行为，将signum信号的默认行为改为handler

//process.cc
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

void handler(int signo)
{
    std::cout<<"发送了一个2号信号"<<std::endl;
    exit(1);
}

int main()
{
    signal(2,handler);
    std::cout << "pid: " << getpid() << std::endl;
    while(1)
    {
        std::cout << "running" << std::endl;
        sleep(1);
    }
    return 0;
}

对信号的进一步理解

man 7 singal 查看信号的默认行为

既然我们能通过signal系统调用将信号的默认方法改变，那么我们能否将所有能杀死进程的信号改掉，使得进程无法被终止呢？？？

很显然是不行的，有些信号是无法被自定义捕捉，比如9号信号，保证了OS的安全

2、通过系统调用进行信号的产生

功能：向pid进程发送sig信号（kill命令就是调用的该系统调用）

举个例子(写一个自己的kill命令)

//test.c
#include <stdio.h>
#include <unistd.h>
int main()
{
    printf("%d\n",getpid());
    while(1)
    {
        printf("running\n");
        sleep(1);
    }
    return 0;
}

//mykill.cc
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

int main(int argc,char* argv[])
{
    if(argc!=3)
    {
        std::cout<<"\nUsage:" << argv[0] <<" -signnumber processid" << std::endl;
        return 0;
    }
    int signnumber = std::stoi(argv[1]+1);
    int pid = std::stoi(argv[2]);
    kill(pid, signnumber);
    return 0;
}

功能：向本进程发送sig信号

举个例子

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout<<"发送了一个" << signo <<"号信号"<<std::endl;
}

int main()
{
    signal(2,handler);
    while(1)
    {
        raise(2);
        sleep(1);
    }
    return 0;
}

功能：向本进程发送6号信号，且进程一定会终止

举个例子

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout<<"发送了一个" << signo <<"号信号"<<std::endl;
}

int main()
{
    std::cout << getpid() << std::endl;
    signal(6,handler);
    // abort();
    while(1)
    {
        std::cout << "running" << std::endl;
        sleep(1);
    }
    return 0;
}

3、通过硬件异常进行信号的产生

原理如下

那么除0异常是发送的哪个信号呢？是8号信号，验证如下

根据上图：发送的确实是8号信号，但现在还有一个问题，进程出异常，OS发送8号信号，可以理解，但是为什么它一直在打印呢，明明我的代码没有循环啊？

因为，原本的8号信号被自定义捕捉成了打印语句，导致进程无法退出，所以进程依旧会在等待队列中等待CPU调度，所以各种寄存器中存放的该进程相关的数据(即进程上下文)都会被保留，包括状态寄存器，而一旦该进程被调度，那么OS就又会检测到硬件错误，向进程发送8信号，如此反复，故有上面的现象发生。

(一旦进程退出，它的相关数据就会被丢弃，因为我们不在需要调度该进程了)

OS杀死进程，就是处理问题的方式之一

程序运行出现异常，如何做取决于用户，但一般都是要让进程退出的（注意：异常的处理，很多时候只是打印错误）

顺便说一下，*nullptr发送的信号是11号信号，本质是页表中没有该地址的物理地址的映射关系，引发的硬件错误

4、通过软件条件进行信号的产生

这个其实在之前的博客中就讲过一些示例，比如管道中只要读端关闭，写端还在写，OS就会向写端发送SIGPIPE，终止写端，它本质是因为OS的内核数据中发现该管道只被一个进程打开，所以发信号终止写端，不是硬件异常，而是软件条件产生的信号。又比如调试程序用的gdb向进程发送的SIGSTOP和SIGCONT都是软件条件产生的信号。

这里再介绍一个alarm函数

#include <unistd.h>
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟，也就是告诉内核在seconds秒之后给当前进程发送SIGALRM信号(14号信号)，该信号的默认处理动作是终止当前进程

演示如下

上面两段代码都是设置了1秒的闹钟，确实时间到了，进程就终止了，但是两段代码cnt++的运行次数却是天差地别，唯一的区别就是有没有与外设进行IO交互，也证明了IO的效率很低

多次使用alarm函数，就是刷新闹钟，并返回之前闹钟剩余的时间，注意：alarm(0)不是设置0秒的闹钟，这个相当于清空之前的闹钟并返回之前闹钟剩余的时间

了解(扩展)---帮助理解alarm

这里讲讲alarm是如何实现的，首先每个进程都能设置闹钟，也就是说OS中可以存在多个闹钟，所以需要管理，即先描述在组织，所以我们要设计一个闹钟结构体，里面包含闹钟所属进程id，时间（用时间戳记录）等等（根据需求往里面加属性）。然后就是如何组织，即选择什么样的数据结构进行管理，这里可以选择用小堆，按照时间大小存放，如果时间堆顶闹钟的时间没到，说明所有的都没到，不做处理，如果时间到了，就拿出来处理。(当然这不一定是Linux中alarm的实现，这里只是提供思想，具体如何实现得根据需求)

core dump(核心转储)

介绍：

分析core dump是Linux应用程序调试的一种有效方式，core dump又称为“核心转储”，是该进程实际使用的物理内存的“快照”。分析core dump文件可以获取应用程序崩溃时的现场信息，如程序运行时的CPU寄存器值、堆栈指针、栈数据、函数调用栈等信息。

Core dump是Linux基于信号实现的。Linux中信号是一种异步事件处理机制，每种信号都对应有默认的异常处理操作，默认操作包括忽略该信号（Ignore）、暂停进程（Stop）、终止进程（Terminate）、终止并产生core dump（Core）等

这里也简单说一下，为什么有的信号终止进程需要核心转储，而有的不需要？

我们可以看一下那些不需要核心转储的终止信号，如SIGKILL，它其实并不是进程出现异常而将进程杀死，更类似于用户强制终止进程，也就是说进程本身并没有问题(或者出错原因很明显)，所以我们不需要core dump再去分析异常，但是像SIGSEGV信号，即段错误信号，我们只能知道是内存出现问题，但是具体是数组越界还是其他什么问题引发的我们并不清楚，所以我们需要core dump帮助我们去分析。

但其实通过上面我们的示例代码和结果截图，我们会发现，Term/Core的功能好像都一样，只是终止进程，并没有产生core dump文件，这是什么原因呢？

因为核心转储的文件太大了，我们用的是服务器，默认将core dump大小设置为0，即不生成核心转储，防止服务器被写满（虚拟机应该是开启的）当然可以通过指令打开，如下

注意：核心转储只能在对应的shell中生成，即哪个shell设置了core dump的大小，哪个shell跑程序收到异常才会生核心转储文件

上面的短短5行代码，就需要生成55万字节的文件，如果代码在多一点，文件只会更大，所以为了保证服务的安全，系统默认将core dump文件大小设置为0

那么核心转储的文件有什么用呢？

三、信号存储

信号的相关概念

实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态，称为信号未决(Pending)---即在信号位图中
进程可以选择阻塞 (Block )某个信号---未决之后，暂时不递达

被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作
注意：阻塞和忽略是不同的，只要信号被阻塞就不会递达，而忽略是在递达之后可选的一种处理动作

如何在OS中体现上面说的三个概念---递达、未决、阻塞？？

每个信号都有两个标志位分别表示阻塞(block)和未决(pending)，还有一个函数指针表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。在上图的例子中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生过，一旦产生SIGQUIT信号将被阻塞，它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次，将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。不讨论实时信号

四、信号阻塞

sigset_t

未决和阻塞标志可以用相同的数据类型sigset_t来存储，sigset_t称为信号集，这个类型可以表示每个信号的“有效”或“无效”状态，在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞，而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask)，这里的“屏蔽”应该理解为阻塞而不是忽略

信号集操作函数

int sigemptyset(sigset_t *set); 将所有信号的对应bit清零，表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set); 将所有信号的对应bit置1，表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo); 在该信号集中添加某种有效信号
int sigdelset(sigset_t *set, int signo); 在该信号集中删除某种有效信号
int sigismember（const sigset_t *set, int signo); 用于判断一个信号集的有效信号中是否包含某种信号，若包含则返回1，不包含则返回0，出错返回-1

注意：在使用sigset_ t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号集处于确定的状态

sigprocmask

功能介绍：如果oset是非空指针，则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针，则更改进程的信号屏蔽字，参数how指示如何更改。假设当前的信号屏蔽字为mask，下表说明了how参数的可选值

SIG_BLOCK set包含我们希望添加到当前信号屏蔽字的信号，相当于mask = mask|set
SIG_UNBLOCK set包含我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask = mask&~set
SIG_SETMASK 设置当前信号屏蔽字为set所指向的值，相当于mask=set

如果调用sigprocmask解除了对当前若干个未决信号的阻塞，则在sigprocmask返回前，至少将其中一个信号递达

演示如下

当然可能有人会说，既然能屏蔽信号，我们能不能将所有的信号全部屏蔽？？？

当然不行，跟有些信号无法被自定义捕捉是一个道理，如9号信号，这里就不验证了

sigpending

读取当前进程的未决信号集，通过set参数传出。调用成功则返回0，出错则返回-1

演示从阻塞到递达的过程，如下
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "接收到" << signo << "信号" << std::endl;
}

void Printf_Pending(const sigset_t &pending)
{
    for (int i = 31; i >= 1; i--)
    {
        if (sigismember(&pending, i))
            std::cout << 1;
        else
            std::cout << 0;
    }
    std::cout << "\n";
}

int main()
{
    std::cout << "pid: " << getpid() << std::endl;
    signal(2, handler);
    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, 2);
    sigprocmask(SIG_BLOCK, &set, nullptr); // 屏蔽2号信号
    std::cout << "屏蔽了2号信号" << std::endl;

    int cnt = 0;
    while (1)
    {
        sigset_t pending;
        sigpending(&pending);
        Printf_Pending(pending);
        sleep(1);
        cnt++;
        if (cnt == 10)
        {
            std::cout << "解除对2号信号的阻塞" << std::endl;
            sigprocmask(SIG_UNBLOCK, &set, nullptr);
        }
    }
    return 0;
}
这里有一个问题：pending位图的置0操作和信号的递达，谁先发生？？？

我们可以在handler方法中打印pending位图，如果已经为0，则置0操作先发生，反之，相反

显然，我们是先将pending位图的对应信号比特位置0，在执行信号的递达操作

五、信号的捕捉

信号在什么时候被处理？

--- 进程从内核态返回用户态的时候，进行信号的检测和递达

用户态是一种受控的状态，能够访问的资源是有限的
内核态是一种OS的共工作状态，能访问大部分系统资源

系统调用的背后，就包含了身份的变化！！！

补充一些进程地址空间的内容

内核空间对应的页表和OS资源只需要一份，因为所有的进程都需要，就像动态库资源我们只要加载一份就行，需要的就去映射。所以CPU在任何时间都能访问OS

可能有人会觉得：如果我的程序中只是在死循环的打印语句，没有进行系统调用，那么信号是不是就被处理了？

当然不是，进程是要被OS调度切换的，而当进程被放在CPU上执行时，本质就已经完成了从OS(内核)到用户的转换，所以信号有无数次机会被检测处理

Sigaction

#include <signal.h>
int sigaction(int signo，const struct sigaction *act，struct sigaction *oact);

功能：可以读取和修改与指定信号相关联的处理动作。调用成功返回0，出错返回-1
参数：signo是指定信号的编号。若act指针非空，则根据act修改该信号的处理动作。若oact指针非空，则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体

（只关注被框出来的两个成员）

将sa_handler赋值为常数SIG_IGN表示忽略信号，赋值为常数SIG_DFL表示执行系统默认动作，赋值为一个函数指针表示用自定义函数捕捉信号。和signal函数的第二个参数类似

当某个信号的处理函数被调用时，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时自动恢复原来的信号屏蔽字。sa_flags字段包含一些选项，这里我们不关心所以把sa_flags设为0，sa_sigaction是实时信号的处理函数

演示如下

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
void Printf_Pending(const sigset_t &pending)
{
    for (int i = 31; i >= 1; i--)
    {
        if (sigismember(&pending, i))
            std::cout << 1;
        else
            std::cout << 0;
    }
    std::cout << "\n";
}

void handler(int signo)
{
    std::cout << "接收到" << signo << "信号" << std::endl;
    while (1)
    {
        sigset_t pending;
        sigpending(&pending);
        Printf_Pending(pending);
        sleep(1);
    }
}

int main()
{
    std::cout << "pid: " << getpid() << std::endl;
    struct sigaction act, oact;
    act.sa_handler = handler;
    sigemptyset(&act.sa_mask);
    sigaddset(&act.sa_mask, 3);
    sigaction(2, &act, &oact);

    while (1)
        sleep(1);
    return 0;
}

显然，sigaction函数不仅将自定义捕捉的2号信号在运行时自行屏蔽，而且可以通过sa_mask同时将其他的信号也屏蔽，注意这些屏蔽会在2号信号处理结束返回后解除

并且返回后，它还是会去检测是否有信号需要被递达，至于信号被处理的顺序和信号优先级有关(这里就不演示了)

六、信号的补充问题(了解)

可重入函数

即可以重复进入的函数，什么意思？举个简单的例子，我们学过用fork创建子进程，当父进程和子进程同时执行printf语句时，就有可能在屏幕上出现交替打印的情况，导致输出的数据不符合预期，这就说明printf语句是不可重入函数。反之，如果多个执行流可以同时进入一个函数，且不发生错误，就是可重入函数。

注意：可重入和不可重入是函数的一个特征，并不能作为评判函数好坏的标准。一般来说，使用公共资源的函数都是不可重入函数。

volatile---保持内存的可见性
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
int flag = 0;
void handler(int sigo)
{
    flag = 1;
    std::cout << "flag changed to :" << flag << std::endl;
}

int main()
{
    signal(2, handler);
    std::cout << "flag:" << flag << std::endl;
    while (!flag)
        ;
    std::cout << "flag:" << flag << std::endl;
    return 0;
}
如果是正常编译程序，不会有问题，一旦优化(相当于release版)就会出bug为什么？

因为flag变量被优化后直接放到了CPU的寄存器中，在信号处理时，我们改变的flag是内存中的flag，并不会改变寄存器中的flag，所以进程无法结束

我们可以给flag加volatile关键字，保证内存的可见性，即保证该变量一直从内存中读取得到

SIGCHLD信号(17号信号)

子进程在终止时会给父进程发SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理函数，这样父进程只需专心处理自己的工作，不必关心子进程了,子进程终止时会通知父进程，父进程在信号处理函数中调用wait清理子进程即可

1、验证子进程终止是否会向父进程发送SIGCHLD信号
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
}

int main()
{
    signal(SIGCHLD, handler);
    pid_t id = fork();
    if(id==0)
    {
        std::cout<<"child running"<<std::endl;
        sleep(5);
        exit(1);
    }

    wait(nullptr);
    return 0;
}
2、在handler函数中回收子进程
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    wait(nullptr);
}

int main()
{
    signal(SIGCHLD, handler);
    std::cout << "father pid: " << getpid() << std::endl;

    pid_t id = fork();
    if (id == 0)
    {
        std::cout << "child pid: " << getpid() << std::endl;
        std::cout << "child running" << std::endl;
        sleep(5);
        exit(1);
    }

    return 0;
}
上面的是针对只有一个子进程的情况，但是如果有多个进程呢？

我们知道如果多个子进程同时退出，发送17号信号，父进程的pending表只会记录一次17号信号，也就只会执行一次wait函数，所以有的子进程就会处于僵尸状态，那我们该如何做？

有人可能觉得用循环就行，如下
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    pid_t id;
    while ((id = wait(nullptr)))
    {
        std::cout << "child pid: " << id << " exit" << std::endl;
        if (id < 0)
            break;
    }
}

int main()
{
    signal(SIGCHLD, handler);
    for (int i = 0; i < 5; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            std::cout << "child is running" << std::endl;
            sleep(5);
            exit(1);
        }
    }

    while(1) sleep(1);
    return 0;
}
事实证明也确实行，但是这是所有子进程都结束的情况，如果有一部分子进程终止，另一部分子进程一直在运行，那么我们就无法跳出循环，因为wait是阻塞等待，它可以去查看是否有进程还没终止，这样就会一直在阻塞。

所以用非阻塞等待才是最恰当的，如下
void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    pid_t id;
    while ((id = waitpid(-1, nullptr, WNOHANG)) > 0)
    {
        std::cout << "child pid: " << id << " exit" << std::endl;
    }
}
当然，如果不关心子进程的返回信息，也可以直接忽略该信号，子进程会自动被清理。如下
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>
int main()
{
    signal(SIGCHLD, SIG_IGN);
    for (int i = 0; i < 5; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            std::cout << "child is running" << std::endl;
            sleep(5);
            exit(1);
        }
    }
    while(1) sleep(1);
    return 0;
}

竹下为生

关注

20
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

int sigemptyset(sigset_t *set);	将所有信号的对应bit清零，表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set);	将所有信号的对应bit置1，表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo);	在该信号集中添加某种有效信号
int sigdelset(sigset_t *set, int signo);	在该信号集中删除某种有效信号
int sigismember（const sigset_t *set, int signo);	用于判断一个信号集的有效信号中是否包含某种信号，若包含则返回1，不包含则返回0，出错返回-1

SIG_BLOCK	set包含我们希望添加到当前信号屏蔽字的信号，相当于mask = mask\|set
SIG_UNBLOCK	set包含我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask = mask&~set
SIG_SETMASK	设置当前信号屏蔽字为set所指向的值，相当于mask=set