Linux：进程信号

三目的有声博客

于 2024-08-19 09:52:14 发布

阅读量232

点赞数 9

文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/MaoRuofeng/article/details/141296966

版权

1：信号概念

———————信号是进程之间事件异步通知的一种方式，属于软中断—————————

2：kill -l命令

1：每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定义 #define SIGINT 2 。

2：编号34以上的是实时信号。（实时信号（Real-time signals）是 Linux 系统中的一种特殊类型的信号，它们可以被用来安全地中断系统调用，而不会破坏进程的内存状态。实时信号的编号从 SIGRTMIN 开始，到 SIGRTMAX 结束，这个范围内的信号可以由用户自定义使用。）这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明：

3：信号处理常见方式

(sigaction函数稍后详细介绍),可选的处理动作有以下三种:

1. 忽略此信号(SIG_IGN)。

2. 执行该信号的默认处理动作（signal(SIGINT, SIG_DFL)）。

3. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。

void sigint_handler(int signum) {
    printf("SIGINT caught!\n");
    // 执行一些清理工作，然后退出
    // ...
    exit(0);
}

int main() {
    signal(SIGINT, sigint_handler); // 设置信号处理函数
    printf("Running... Press Ctrl+C to generate SIGINT.\n");
    while (1) {
        // 进程持续运行
    }
    return 0;
}

4：产生信号

1. 通过终端按键产生信号

SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump,现在我们来验证一下。

Core Dump
当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug（事后调试）。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024

写一个死循环程序:

Ctrl - \:

ulimit命令改变了Shell进程的Resource Limit,test进程的PCB由Shell进程复制而来,所以也具有和Shell进程相同的Resource Limit值,这样就可以产生Core Dump了。使用core文件:

2. 调用系统函数向进程发信号

首先在后台执行死循环程序,然后用kill命令给它发SIGSEGV信号：

4568是test进程的id。之所以要再次回车才显示 Segmentation fault ,是因为在4568进程终止掉之前已经回到了Shell提示符等待用户输入下一条命令,Shell不希望Segmentation fault信息和用户的输入交错在一起,所以等用户输入命令之后才显示。

指定发送某种信号的kill命令可以有多种写法,上面的命令还可以写成 kill -SIGSEGV 4568 或 kill -11 4568 , 11是信号SIGSEGV的编号。以往遇到的段错误都是由非法内存访问产生的,而这个程序本身没错,给它发SIGSEGV也能产生段错误。

kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。raise函数可以给当前进程发送指定的信号(自己给自己发信号)。

abort函数使当前进程接收到信号而异常终止。

abort函数通常用来立即终止程序的执行，并返回一个非零的退出状态。在C语言中，abort函数会清理临时文件，关闭文件描述符，并且调用注册的退出处理程序。然后，它会终止程序的执行，通常会导致进程以状态码SIGABRT退出。

3. 由软件条件产生信号

alarm函数和SIGALRM信号

alarm函数用于安排一个定时器，当定时器到达指定时间后，会向进程发送SIGALRM信号。这个信号的默认行为是终止进程，但可以通过signal或sigaction函数来改变信号的处理方式。

4. 硬件异常产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

总结

1：上面所说的所有信号产生，最终都要有OS来进行执行，为什么？OS是进程的管理者

2：信号的处理是否是立即处理的？在合适的时候

3：信号如果不是被立即处理，那么信号是否需要暂时被进程记录下来？要

4：记录在哪里最合适呢？

信号被记录在进程的信号表（signal table）中。这是一个数据结构，用于跟踪所有发送给进程的信号以及它们的当前状态。（信号表是进程在操作系统内核中的一个数据结构，它并不存在于用户空间。信号表的确切实现和存储位置依赖于具体的操作系统，但通常来说，信号表是进程控制块（Process Control Block, PCB）或任务结构体（task_struct，在Linux中）的一部分）

5：一个进程在没有收到信号的时候，能否能知道，自己应该对合法信号作何处理呢？

进程可以通过设置信号处理函数来定义对不同信号的响应。这些处理函数是在信号被接收时调用的，进程可以通过查看信号处理函数的设置来知道它应该对哪些信号做出响应以及如何响应。

6：如何理解OS向进程发送信号？能否描述一下完整的发送处理过程？

信号发送：可以由另一个进程使用如kill函数发送信号，或者由操作系统在特定条件下产生信号。
信号传递：操作系统的内核将信号传递给目标进程。
信号检查：进程在执行时会定期检查是否有信号需要处理。
信号处理函数调用：如果进程为该信号设置了处理函数，并且信号没有被阻塞，内核将调用该处理函数。
执行处理逻辑：处理函数执行定义的逻辑，例如清理资源、保存状态或优雅地终止进程。
信号清除：一旦信号被处理，它将从进程的信号表中清除。
继续执行：进程继续执行，直到收到下一个信号或完成其任务。

5：阻塞信号

1. 信号其他相关常见概念

实际执行信号的处理动作称为信号递达(Delivery)。

信号从产生到递达之间的状态,称为信号未决(Pending)。

进程可以选择阻塞 (Block )某个信号。

被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.

注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

2. 在内核中的表示

两张位图 + 一张函数指针数组 == 让进程识别信号！

信号在内核中的表示示意图

每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。

在上图的例子中：

SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。

SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。

SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?

POSIX.1允许系统递送该信号一次或多次。

Linux是这样实现的:

常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。

3. sigset_t

从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

4. 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的！

头文件：<signal.h>

函数声明：

int sigemptyset(sigset_t *set);
功能：清空信号集，将信号集中的所有信号位设置为0。
参数：set，指向sigset_t类型的指针，表示要操作的信号集。
返回值：成功时返回0，失败时返回-1并设置errno。

int sigfillset(sigset_t *set);
功能：填充信号集，将信号集中的所有信号位设置为1。
参数：同上。
返回值：同上。

int sigaddset (sigset_t *set, int signo);
功能：向信号集中添加一个信号。
参数：set，信号集的指针；signo，要添加的信号的编号。
返回值：同上。

int sigdelset(sigset_t *set, int signo);
功能：从信号集中删除一个信号。
参数：同上。
返回值：同上。

int sigismember（const sigset_t *set, int signo);
功能：检查信号集中是否包含特定的信号。
参数：set，信号集的指针；signo，要检查的信号的编号。
返回值：如果信号集中包含该信号，返回1；如果不包含，返回0；失败时返回-1并设置errno。

注意：

在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

int sigprocmask(int how, const sigset_t *set, sigset_t *oset);

参数：
    how：指定了如何修改当前信号屏蔽字。
它可以是以下宏之一：
    SIG_BLOCK：阻塞在set中指定的信号。
    SIG_UNBLOCK：取消阻塞在set中指定的信号。
    SIG_SETMASK：设置当前信号屏蔽字为set指向的信号集。
    set：指向一个sigset_t类型的信号集，包含了要操作的信号集合。
    oset：（可选参数）如果非空，函数会将操作前的信号屏蔽字复制到这个位置。

返回值：
    成功时返回0。
    出错时返回-1，并设置全局变量errno以指示错误类型。

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。

sigpending

int sigpending(sigset_t *set);

参数
    set：指向sigset_t类型的指针，用于存储当前进程的待处理信号集。
    待处理信号集包含了所有已经到达但尚未被进程处理的信号。
返回值
    成功时返回0。
    出错时返回-1，并设置全局变量errno以指示错误类型。

程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会使SIGINT信号处于未决状态,按Ctrl-\仍然可以终止程序,因为SIGQUIT信号没有阻塞。

6：捕捉信号

1. 内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。当前正在执行main函数,这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

内核态 VS 用户态？

2. sigaction

#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

参数：
    signo：指定要操作的信号的编号。
    act：指向一个sigaction结构的指针，该结构定义了信号的处理方式。如果这个参数是NULL，函数只返回当前信号处理的状态，不改变它。
    oact：（可选参数）如果这个参数非空，函数会将信号的当前处理方式存储在这个结构中。

返回值：
    成功时返回0。
    出错时返回-1，并设置全局变量errno以指示错误类型。
    
结构体sigaction：
    sigaction结构体定义了信号的处理方式，通常包含以下成员：
    sa_handler：指向信号处理函数的指针。如果设置为SIG_IGN，则信号被忽略；如果设置为SIG_DFL，则使用默认信号处理方式。
    sa_mask：信号集，定义了在信号处理函数执行期间要阻塞的信号。
    sa_flags：指定信号处理的一些选项，如是否在处理信号时设置信号的默认行为等。

1：sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体。

2：将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。

7：可重入函数

1：main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。

像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱?

如果一个函数符合以下条件之一则是不可重入的:

A：调用了malloc或free,因为malloc也是用全局链表来管理堆的。

B：调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

8：volatile

volatile 作用：保持内存的可见性，告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行操作。

9：SIGCHLD信号

进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。

其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。

请编写一个程序完成以下功能:父进程fork出子进程,子进程调用exit(2)终止,父进程自定义SIGCHLD信号的处理函数,在其中调用wait获得子进程的退出状态并打印？

事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <sys/types.h>
#include <sys/wait.h>

void handler(int sig)
{
    pid_t id;
    while ((id = waitpid(-1, NULL, WNOHANG)) > 0)
    {
        printf("wait child success: %d\n", id);
    }
    printf("child is quit! %d\n", getpid());
}
int main()
{
    signal(SIGCHLD, handler);
    pid_t cid;
    if ((cid = fork()) == 0)
    { // child
        printf("child : %d\n", getpid());
        sleep(3);
        exit(1);
    }
    while (1)
    {
        printf("father proc is doing some thing!\n");
        sleep(1);
    }
    return 0;
}