Linux---进程信号

一、信号的概念

 信号是一种向目标进程发送通知消息的机制

信号的特性(可以结合红绿灯、防空警报等生活样例来理解)

1、在信号没有出现之前,我们就已经知道如何去处理信号,即我们认识信号

2、信号是异步产生的,即我们不知道它具体何时产生

3、当信号产生时,我们可以对它暂时忽略不做处理(比如我们外卖到了,但是你正在和朋友开黑,就会将外卖暂时搁置)

4、由于我们有时不会立即去执行信号,所以我们需要能储存信号

信号列表如下

一些补充的知识

二、信号的产生

 1、通过键盘进行信号的产生

解释如下

该系统调用接口可以自定义捕捉信号的行为,将signum信号的默认行为改为handler

//process.cc
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

void handler(int signo)
{
    std::cout<<"发送了一个2号信号"<<std::endl;
    exit(1);
}

int main()
{
    signal(2,handler);
    std::cout << "pid: " << getpid() << std::endl;
    while(1)
    {
        std::cout << "running" << std::endl;
        sleep(1);
    }
    return 0;
}

对信号的进一步理解

 man 7 singal  查看信号的默认行为

既然我们能通过signal系统调用将信号的默认方法改变,那么我们能否将所有能杀死进程的信号改掉,使得进程无法被终止呢???

 很显然是不行的,有些信号是无法被自定义捕捉,比如9号信号,保证了OS的安全

2、通过系统调用进行信号的产生

功能:向pid进程发送sig信号(kill命令就是调用的该系统调用)

举个例子(写一个自己的kill命令)

//test.c
#include <stdio.h>
#include <unistd.h>
int main()
{
    printf("%d\n",getpid());
    while(1)
    {
        printf("running\n");
        sleep(1);
    }
    return 0;
}

//mykill.cc
#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

int main(int argc,char* argv[])
{
    if(argc!=3)
    {
        std::cout<<"\nUsage:" << argv[0] <<" -signnumber processid" << std::endl;
        return 0;
    }
    int signnumber = std::stoi(argv[1]+1);
    int pid = std::stoi(argv[2]);
    kill(pid, signnumber);
    return 0;
}

功能:向本进程发送sig信号

举个例子

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout<<"发送了一个" << signo <<"号信号"<<std::endl;
}

int main()
{
    signal(2,handler);
    while(1)
    {
        raise(2);
        sleep(1);
    }
    return 0;
}

功能:向本进程发送6号信号,且进程一定会终止

举个例子

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout<<"发送了一个" << signo <<"号信号"<<std::endl;
}

int main()
{
    std::cout << getpid() << std::endl;
    signal(6,handler);
    // abort();
    while(1)
    {
        std::cout << "running" << std::endl;
        sleep(1);
    }
    return 0;
}

3、通过硬件异常进行信号的产生

原理如下

那么除0异常是发送的哪个信号呢?是8号信号,验证如下

根据上图:发送的确实是8号信号,但现在还有一个问题,进程出异常,OS发送8号信号,可以理解,但是为什么它一直在打印呢,明明我的代码没有循环啊?

因为,原本的8号信号被自定义捕捉成了打印语句,导致进程无法退出,所以进程依旧会在等待队列中等待CPU调度,所以各种寄存器中存放的该进程相关的数据(即进程上下文)都会被保留,包括状态寄存器,而一旦该进程被调度,那么OS就又会检测到硬件错误,向进程发送8信号,如此反复,故有上面的现象发生。

(一旦进程退出,它的相关数据就会被丢弃,因为我们不在需要调度该进程了)

OS杀死进程,就是处理问题的方式之一

程序运行出现异常,如何做取决于用户,但一般都是要让进程退出的(注意:异常的处理,很多时候只是打印错误)

顺便说一下,*nullptr发送的信号是11号信号,本质是页表中没有该地址的物理地址的映射关系,引发的硬件错误

4、通过软件条件进行信号的产生

这个其实在之前的博客中就讲过一些示例,比如管道中只要读端关闭,写端还在写,OS就会向写端发送SIGPIPE,终止写端,它本质是因为OS的内核数据中发现该管道只被一个进程打开,所以发信号终止写端,不是硬件异常,而是软件条件产生的信号。又比如调试程序用的gdb向进程发送的SIGSTOP和SIGCONT都是软件条件产生的信号。

这里再介绍一个alarm函数

#include <unistd.h>
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发送SIGALRM信号(14号信号),该信号的默认处理动作是终止当前进程

 演示如下

上面两段代码都是设置了1秒的闹钟,确实时间到了,进程就终止了,但是两段代码cnt++的运行次数却是天差地别,唯一的区别就是有没有与外设进行IO交互,也证明了IO的效率很低

 

多次使用alarm函数,就是刷新闹钟,并返回之前闹钟剩余的时间,注意:alarm(0)不是设置0秒的闹钟,这个相当于清空之前的闹钟并返回之前闹钟剩余的时间

了解(扩展)---帮助理解alarm

这里讲讲alarm是如何实现的,首先每个进程都能设置闹钟,也就是说OS中可以存在多个闹钟,所以需要管理,即先描述在组织,所以我们要设计一个闹钟结构体,里面包含闹钟所属进程id,时间(用时间戳记录)等等(根据需求往里面加属性)。然后就是如何组织,即选择什么样的数据结构进行管理,这里可以选择用小堆,按照时间大小存放,如果时间堆顶闹钟的时间没到,说明所有的都没到,不做处理,如果时间到了,就拿出来处理。(当然这不一定是Linux中alarm的实现,这里只是提供思想,具体如何实现得根据需求)

core dump(核心转储) 

介绍:

分析core dump是Linux应用程序调试的一种有效方式,core dump又称为“核心转储”,是该进程实际使用的物理内存的“快照”。分析core dump文件可以获取应用程序崩溃时的现场信息,如程序运行时的CPU寄存器值、堆栈指针、栈数据、函数调用栈等信息。

Core dump是Linux基于信号实现的。Linux中信号是一种异步事件处理机制,每种信号都对应有默认的异常处理操作,默认操作包括忽略该信号(Ignore)、暂停进程(Stop)、终止进程(Terminate)、终止并产生core dump(Core)等

这里也简单说一下,为什么有的信号终止进程需要核心转储,而有的不需要?

我们可以看一下那些不需要核心转储的终止信号,如SIGKILL,它其实并不是进程出现异常而将进程杀死,更类似于用户强制终止进程,也就是说进程本身并没有问题(或者出错原因很明显),所以我们不需要core dump再去分析异常,但是像SIGSEGV信号,即段错误信号,我们只能知道是内存出现问题,但是具体是数组越界还是其他什么问题引发的我们并不清楚,所以我们需要core dump帮助我们去分析。

但其实通过上面我们的示例代码和结果截图,我们会发现,Term/Core的功能好像都一样,只是终止进程,并没有产生core dump文件,这是什么原因呢?

因为核心转储的文件太大了,我们用的是服务器,默认将core dump大小设置为0,即不生成核心转储,防止服务器被写满(虚拟机应该是开启的)当然可以通过指令打开,如下

注意:核心转储只能在对应的shell中生成,即哪个shell设置了core dump的大小,哪个shell跑程序收到异常才会生核心转储文件

上面的短短5行代码,就需要生成55万字节的文件,如果代码在多一点,文件只会更大,所以为了保证服务的安全,系统默认将core dump文件大小设置为0

那么核心转储的文件有什么用呢?

三、信号存储

信号的相关概念

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)---即在信号位图中
  • 进程可以选择阻塞 (Block )某个信号---未决之后,暂时不递达

被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
注意:阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作

如何在OS中体现上面说的三个概念---递达、未决、阻塞??

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
  • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。不讨论实时信号

四、信号阻塞

sigset_t

未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略

信号集操作函数

int sigemptyset(sigset_t *set);将所有信号的对应bit清零,表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set);将所有信号的对应bit置1,表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo);在该信号集中添加某种有效信号
int sigdelset(sigset_t *set, int signo);在该信号集中删除某种有效信号
int sigismember(const sigset_t *set, int signo);用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1

注意:在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态

 sigprocmask

功能介绍:如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值

SIG_BLOCKset包含我们希望添加到当前信号屏蔽字的信号,相当于mask = mask|set
SIG_UNBLOCKset包含我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask = mask&~set
SIG_SETMASK设置当前信号屏蔽字为set所指向的值,相当于mask=set

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达

演示如下

当然可能有人会说,既然能屏蔽信号,我们能不能将所有的信号全部屏蔽???

当然不行,跟有些信号无法被自定义捕捉是一个道理,如9号信号,这里就不验证了

 sigpending

读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1

演示从阻塞到递达的过程,如下

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "接收到" << signo << "信号" << std::endl;
}

void Printf_Pending(const sigset_t &pending)
{
    for (int i = 31; i >= 1; i--)
    {
        if (sigismember(&pending, i))
            std::cout << 1;
        else
            std::cout << 0;
    }
    std::cout << "\n";
}

int main()
{
    std::cout << "pid: " << getpid() << std::endl;
    signal(2, handler);
    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, 2);
    sigprocmask(SIG_BLOCK, &set, nullptr); // 屏蔽2号信号
    std::cout << "屏蔽了2号信号" << std::endl;

    int cnt = 0;
    while (1)
    {
        sigset_t pending;
        sigpending(&pending);
        Printf_Pending(pending);
        sleep(1);
        cnt++;
        if (cnt == 10)
        {
            std::cout << "解除对2号信号的阻塞" << std::endl;
            sigprocmask(SIG_UNBLOCK, &set, nullptr);
        }
    }
    return 0;
}

这里有一个问题:pending位图的置0操作和信号的递达,谁先发生???

我们可以在handler方法中打印pending位图,如果已经为0,则置0操作先发生,反之,相反

显然,我们是先将pending位图的对应信号比特位置0,在执行信号的递达操作

五、信号的捕捉

信号在什么时候被处理?

--- 进程从内核态返回用户态的时候,进行信号的检测和递达

  • 用户态是一种受控的状态,能够访问的资源是有限的
  • 内核态是一种OS的共工作状态,能访问大部分系统资源

系统调用的背后,就包含了身份的变化!!!

补充一些进程地址空间的内容

内核空间对应的页表和OS资源只需要一份,因为所有的进程都需要,就像动态库资源我们只要加载一份就行,需要的就去映射。所以CPU在任何时间都能访问OS

可能有人会觉得:如果我的程序中只是在死循环的打印语句,没有进行系统调用,那么信号是不是就被处理了?

当然不是,进程是要被OS调度切换的,而当进程被放在CPU上执行时,本质就已经完成了从OS(内核)到用户的转换,所以信号有无数次机会被检测处理

Sigaction

#include <signal.h>
int sigaction(int signo,const struct sigaction *act,struct sigaction *oact);

  • 功能:可以读取和修改与指定信号相关联的处理动作。调用成功返回0,出错返回-1
  • 参数:signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体

(只关注被框出来的两个成员)

将sa_handler赋值为常数SIG_IGN表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号。和signal函数的第二个参数类似

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。sa_flags字段包含一些选项,这里我们不关心所以把sa_flags设为0,sa_sigaction是实时信号的处理函数

演示如下

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
void Printf_Pending(const sigset_t &pending)
{
    for (int i = 31; i >= 1; i--)
    {
        if (sigismember(&pending, i))
            std::cout << 1;
        else
            std::cout << 0;
    }
    std::cout << "\n";
}

void handler(int signo)
{
    std::cout << "接收到" << signo << "信号" << std::endl;
    while (1)
    {
        sigset_t pending;
        sigpending(&pending);
        Printf_Pending(pending);
        sleep(1);
    }
}

int main()
{
    std::cout << "pid: " << getpid() << std::endl;
    struct sigaction act, oact;
    act.sa_handler = handler;
    sigemptyset(&act.sa_mask);
    sigaddset(&act.sa_mask, 3);
    sigaction(2, &act, &oact);

    while (1)
        sleep(1);
    return 0;
}

显然,sigaction函数不仅将自定义捕捉的2号信号在运行时自行屏蔽,而且可以通过sa_mask同时将其他的信号也屏蔽,注意这些屏蔽会在2号信号处理结束返回后解除

并且返回后,它还是会去检测是否有信号需要被递达,至于信号被处理的顺序和信号优先级有关(这里就不演示了)

 六、信号的补充问题(了解)

可重入函数

即可以重复进入的函数,什么意思?举个简单的例子,我们学过用fork创建子进程,当父进程和子进程同时执行printf语句时,就有可能在屏幕上出现交替打印的情况,导致输出的数据不符合预期,这就说明printf语句是不可重入函数。反之,如果多个执行流可以同时进入一个函数,且不发生错误,就是可重入函数。

注意:可重入和不可重入是函数的一个特征,并不能作为评判函数好坏的标准。一般来说,使用公共资源的函数都是不可重入函数。

 volatile---保持内存的可见性

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
int flag = 0;
void handler(int sigo)
{
    flag = 1;
    std::cout << "flag changed to :" << flag << std::endl;
}

int main()
{
    signal(2, handler);
    std::cout << "flag:" << flag << std::endl;
    while (!flag)
        ;
    std::cout << "flag:" << flag << std::endl;
    return 0;
}

如果是正常编译程序,不会有问题,一旦优化(相当于release版)就会出bug为什么?

因为flag变量被优化后直接放到了CPU的寄存器中,在信号处理时,我们改变的flag是内存中的flag,并不会改变寄存器中的flag,所以进程无法结束

我们可以给flag加volatile关键字,保证内存的可见性,即保证该变量一直从内存中读取得到

SIGCHLD信号(17号信号)

子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自 定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可

1、验证子进程终止是否会向父进程发送SIGCHLD信号

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
}

int main()
{
    signal(SIGCHLD, handler);
    pid_t id = fork();
    if(id==0)
    {
        std::cout<<"child running"<<std::endl;
        sleep(5);
        exit(1);
    }

    wait(nullptr);
    return 0;
}

2、在handler函数中回收子进程

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    wait(nullptr);
}

int main()
{
    signal(SIGCHLD, handler);
    std::cout << "father pid: " << getpid() << std::endl;

    pid_t id = fork();
    if (id == 0)
    {
        std::cout << "child pid: " << getpid() << std::endl;
        std::cout << "child running" << std::endl;
        sleep(5);
        exit(1);
    }

    return 0;
}

上面的是针对只有一个子进程的情况,但是如果有多个进程呢?

我们知道如果多个子进程同时退出,发送17号信号,父进程的pending表只会记录一次17号信号,也就只会执行一次wait函数,所以有的子进程就会处于僵尸状态,那我们该如何做?

有人可能觉得用循环就行,如下

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    pid_t id;
    while ((id = wait(nullptr)))
    {
        std::cout << "child pid: " << id << " exit" << std::endl;
        if (id < 0)
            break;
    }
}

int main()
{
    signal(SIGCHLD, handler);
    for (int i = 0; i < 5; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            std::cout << "child is running" << std::endl;
            sleep(5);
            exit(1);
        }
    }

    while(1) sleep(1);
    return 0;
}

事实证明也确实行,但是这是所有子进程都结束的情况,如果有一部分子进程终止,另一部分子进程一直在运行,那么我们就无法跳出循环,因为wait是阻塞等待,它可以去查看是否有进程还没终止,这样就会一直在阻塞。

所以用非阻塞等待才是最恰当的,如下

void handler(int signo)
{
    std::cout << "get " << signo << " sign" << std::endl;
    pid_t id;
    while ((id = waitpid(-1, nullptr, WNOHANG)) > 0)
    {
        std::cout << "child pid: " << id << " exit" << std::endl;
    }
}

当然,如果不关心子进程的返回信息,也可以直接忽略该信号,子进程会自动被清理。如下

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <sys/types.h>
int main()
{
    signal(SIGCHLD, SIG_IGN);
    for (int i = 0; i < 5; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            std::cout << "child is running" << std::endl;
            sleep(5);
            exit(1);
        }
    }
    while(1) sleep(1);
    return 0;
}

  • 20
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值