Linux操作系统学习（信号处理）

最新推荐文章于 2024-01-28 21:18:05 发布

hxMGE

最新推荐文章于 2024-01-28 21:18:05 发布

阅读量689

点赞数

文章标签： linux 学习信号处理

本文链接：https://blog.csdn.net/hxMGE/article/details/129329729

版权

文章目录

进程信号

进程信号

信号在生活中无处不在，例如闹钟、红绿灯，快递到达发的短信等等

信号的例子

例如在网上你买了一个东西就是信号的注册；

快递员该你打电话要你拿一下快递，就是给你发送了一个信号；

你收到信号之后，你知道怎么去处理这个信号，在这里就是去拿快递；

但是你也不一定立马去拿，你可能会等你忙完现在的事在去处理；

从技术的角度说，平时电脑上按alt+f4就是一种信号，它会关闭当前的窗口，Linux中ctrl+c可以终止进程

信号是进程之间事件异步通知的一种方式，属于软中断

信号的种类

信号的种类可以通过kill -l命令来查看 Linux 系统的信号列表：

如图，其中1-31是普通信号，也是我们在这里要重点学习的信号；34-64是实时信号

信号的产生方式（信号产生前）

1. 硬件产生

例如当我们的程序发生死循环时，按下CTRL+C，就可以终止进程。CTRL+C的本质其实是向进程发送2号信号SIGINT，而SIGINT的默认处理动作是从键盘中断（man 7 signal查看手册） $[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VTvqddQK-1677869450654)(G:\Typora\图片保存\image-20221214154303667.png)]$

那我们可以把信号2的默认处理动作更换成我们自己的验证一下，这里需要用到

sighandler_t signal(int signum, sighandler_t handler);

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3kNBz0Xz-1677869450655)(G:\Typora\图片保存\image-20221214155833259.png)]$

这里我让收到2号信号后先打印一段话再退出

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>

void mysignal_2(int signo)
{
  printf("你好signo:%d\n",signo);
  exit(1);
}

int main()
{
  signal(2,mysignal_2);	//相当于一个函数指针，这里填的函数名相当于函数地址
  while(1)
  {
    printf("hello\n");
    sleep(1);
  }
  return 0;
}

可以看到运行结果：按下ctrl+c后，先打印再终止进程

例如野指针问题引起的段错误，只要运行程序就会崩溃，那么下面验证一下

先把1-31的信号处理动作全部换成自定义，之后捕捉信号查看野指针对应的信号

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>

void handler(int signo)
{
  printf("signo:%d\n",signo);
  exit(1);
}

int main()
{
  int sig = 1;
  for(;sig <= 31; sig++)
  {
    signal(sig,handler);
  }

  while(1)
  {
    int* p = NULL;
    *p = 100;
    printf("hello\n");
    sleep(1);
  }
  return 0;
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qxXzYKmv-1677869450655)(G:\Typora\图片保存\image-20221214163925778.png)]$

运行结果可知：野指针引起的进程崩溃是收到了11信号

再例如除0错误，把上面的代码修改一下进行验证：

  while(1)
  {
	int i= 0;
    i /= 0;
    printf("hello\n");
    sleep(1);
  }

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CIMfELxe-1677869450655)(G:\Typora\图片保存\image-20221214164611138.png)]$

可以看到，进程也是直接就崩溃了，是因为收到了8号信号

上述提到的ctrl+c、除0错误、野指针的段错误为什么会产生退出信号呢？

首先要知道，os是硬件的管理者，负责管理好硬件资源监视硬件状态等等，

ctrl+c是由键盘发出的，os检测到键盘发出的信号就会向进程发出2号信号；
除0时是在CPU中运算的，CPU中有一些寄存器，会记录运行的状态，除0时的运算会产生异常寄存器就会记录这个状态，OS检测到这个异常状态，就会向进程发送8号信号；
当我们对空指针进行直接赋值时，OS会发现我们的进程地址空间与物理内存的映射对不上，就会向进程发送11号信号

综上这些错误分别体现在键盘、CPU、内存中，所以软件层面上的错误。

也就是体现在硬件或其他软件上，而OS是硬件的管理者，发现硬件出现一些异常，就会反馈回出现异常的代码所在的进程上，进程根据对应的信号进行处理（上面提到的错误都是默认终止进程）

2.调用系统函数向进程发信号

系统提供了一些函数接口，可以手动发送信号

int kill(pid_t pid, int signo);

pid 表示目标进程的 pid 。
sig 表示要发给目标进程的信号。
成功返回0，失败返回-1

#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
#include <unistd.h>

static void Usage(const char* proc)
{
  printf("Usage:\n\t %s signo who \n",proc);
}

int main(int argc ,char* argv[])
{
  if(argc != 3)
  {
    Usage(argv[0]);
    return 1;
  }
  int signo = atoi(argv[1]);
  int who = atoi(argv[2]);
  kill(who,signo);
  printf("signo:%d who:%d\n",signo,who);
  return 0;
}

int raise(int signo);

给自己发送信号，signo：要发送的信号
```
int main()
{
  sleep(1);
  raise(3);
  return 0;
}
```
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mgEF0iBy-1677869450655)(G:\Typora\图片保存\image-20221214201136487.png)]$
void abort(void);

给自己发送固定的信号6

3.软件产生

unsigned int alarm(unsigned int seconds);

seconds是代表几秒后执行
执行成功返回0，取消定时则返回剩余秒数

调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动作是终止当前进程。

int main()
{
  alarm(30);
  sleep(4);
  int ret = alarm(0);	//取消定时
  printf("%d\n",ret);
  return 0;
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dP9bGlnH-1677869450656)(G:\Typora\图片保存\image-20221214202909726.png)]$

还有管道通信时，写端退出，读端收到13号信号等等

4.定位进程崩溃的代码（进程异常退出产生信号）

进程退出一般分为三种：

代码运行完毕，结果正常
代码运行完毕，结果不正常
代码异常直接终止

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zOC7U3zf-1677869450656)(G:\Typora\图片保存\image-20221214173606756.png)]$

如图：退出码+退出信号+core dump标志位共16位，waitpid函数接口的第二个参数可以获取到并查看退出码和退出信号

（具体用法自行搜索，这里不做介绍）

在Linux中是可以定位到具体崩溃到哪一行的代码的，当一个进程退出的时候它会根据退出的情况置退出码或者退出信号，表明退出的原因，如果必要，OS会设置退出信息中的core dump标志位，并将进程在内存中的数据转存到磁盘上，以便后期调试

云服务器上的core dump是默认关闭的，可以输入 ulimit -c 102400打开core dump，ulimit -a 可以查看

这里用除0错误演示一下：

int main()
{
  while(1)
  {
    int i = 0;
    i /= 0;
    printf("hello\n");
    sleep(1);
  }
  return 0;
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dp8esyod-1677869450656)(G:\Typora\图片保存\image-20221214175457061.png)]$

在我们运行程序后，除了显示退出原因，还会显示（core dumped），并且多了一个 core.5195文件，之后利用gdp调试打开我的可执行程序（Linux默认是release版本的，需要在编译时加上 -g）

之后输入core-file core.5195加载 core.5195文件

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6yR75XBw-1677869450656)(G:\Typora\图片保存\image-20221214180814488.png)]$

也不是所有信号都会core dump，例如死循环使用ctrl+c的2号信号，或者 kill -9杀掉进程就没有core dump

总结：信号产生的方式有很多，但本质都是由OS向目标进程发送的

信号保存的方式（信号产生中）

在Linux中，一个进程收到信号也不一定马上处理，待当前工作处理完成后寻找合适时机处理，那就需要PCB有保存信号的能力

先来解释三个名词：

实际执行信号的处理动作称为信号递达（delivery）

信号递达可以是自定义捕捉、默认、忽略

信号从产生到递达之间的状态称为信号未决（Pending）

本质是这个信号因为一些原因（如优先级低等）被暂时存在了task_struct中

进程可以选择阻塞某个信号（block）

本质是OS允许进程暂时屏蔽指定的信号，被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作

注意，阻塞和忽略是不同的，只要信号被阻塞就不会递达，而忽略是在递达之后可选的一种处理动作。

在进程的task_struct内有三张表，是用来保存信号状态的

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vsoqPlGr-1677869450657)(G:\Typora\图片保存\image-20221219151642069.png)]$

pending 表和 block 表都是位图，而 handler 表是一个函数指针数组，指向的是信号递达时对应的处理动作(默认/忽略/自定义)

pending和block位图的比特位的位置代表信号的编号

pending位图的内容代表是否收到信号

block位图内容代表是否被阻塞（阻塞位图也叫信号屏蔽字）

信号处理过程示例：

只要block为1，那么pending不管是1还是0，该信号都是阻塞状态

有了这三张表，进程就可以识别信号了

因为task_struct是内核的，没有人能写入到内核，只有OS可以，所以信号的产生方式都是由OS统一向PCB发送的，

（不是所有信号都会被屏蔽，例如9号信号）

获取pending表&&修改block表

pending表和block表的位图结构，就是由这个sigset_t的类型来存储的。sigset_t是一个位图结构类型，称为信号集；这个类型可以表示每个信号的有效或无效状态，在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决定状态。

由于每个平台的sigset_t信号集实现位图的方法不一定一样，所以不推荐用户对这个信号集直接进行修改信号集，需要通过OS提供的信号集操作函数进行修改。

#include <signal.h>
int sigemptyset(sigset_t *set);						
int sigfillset(sigset_t *set);						
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);

int sigemptyset(sigset_t *set)：

初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号

成功返回0，失败返回-1

int sigfillset(sigset_t *set)：

初始化 set ，将其中所有信号对应的比特位置 1 。

成功返回0，失败返回-1

int sigaddset (sigset_t *set, int signo)

把signo信号添加到 set 集合里，其实就是把signo信号对应的比特位由 0 置 1

成功返回0，失败返回-1

int sigdelset(sigset_t *set, int signo)

把 signo 信号从 set 集合里删去，其实就是把 signo 信号对应的比特位由 1 置 0

成功返回0，失败返回-1

int sigismember(const sigset_t *set, int signo)

判定 signo 信号是否在 set 集合里，其实就是判定 signo 信号对应的比特位是否为 1

包含就返回1，不包含返回0，失败返回-1

有了上面的信号集操作函数后，想要修改block表就需要用到sigprocmask 系统调用

sigprocmask：获取或更改当前进程的信号屏蔽字

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nWmHfr8g-1677869450657)(G:\Typora\图片保存\image-20221219211854058.png)]$

how：表示要对信号屏蔽字进行的操作类型

SIG_BLOCK：set 包含了我们希望添加到当前信号屏蔽字的信号。（mask = mask | set ）
SIG_UNBLOCK：set 包含了我们希望从当前信号屏蔽字中解除阻塞的信号。（mask = mask & ~set）
SIG_SETMASK：设置当前信号屏蔽字为 set 。（mask = set）常用

set：输入型参数，就是我们要设置的信号集的指针

oldset：输出型参数，用来获取原信号集（可设置NULL）

返回值：成功返回0，失败返回-1

而想要获取pending表就要用到sigpending 系统调用

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3M7fQ57x-1677869450657)(G:\Typora\图片保存\image-20221219212903416.png)]$

参数：传出型参数，用于存储进程pending表
返回值：成功返回0，失败返回-1

示例：阻塞2号信号

void test1()
{
  sigset_t iset,oset;
  //1.先清空
  sigemptyset(&iset);
  sigemptyset(&oset);

  //2.给iset指定信号编号
  sigaddset(&iset,2);

  //3.设置屏蔽字
  sigprocmask(SIG_SETMASK,&iset,&oset);

  while(1)
  {
    printf("hello\n");
    sleep(1);
  }
  
}

这时按ctrl+c是无效的，只能通过kill -9来结束进程

示例：先阻塞2号信号，后获取pending表并打印，20秒后放开2号信号

void test2()
{
  //设置信号集
  sigset_t iset,oset;
  sigemptyset(&iset);
  sigemptyset(&oset);
  //初始化信号集
  sigaddset(&iset,2);
  sigprocmask(SIG_SETMASK,&iset,&oset);	//阻塞

  
  sigset_t pending;//用于获取打印用
  int count = 0;
  while(1)
  {
    if(count == 20)
      sigprocmask(SIG_SETMASK,&oset,NULL);		//解除2号的阻塞（更改阻塞的信号集为oset，oset为全0）

    sigemptyset(&pending);		//先清空
    sigpending(&pending);		//在获取
    sleep(1);					//延时1s
    count++;					//计数
    show_pending(&pending);		//打印
  }
}

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EJaJZlWU-1677869450658)(G:\Typora\图片保存\image-20221219213539924.png)]$

20s后，2号被取消阻塞，信号递达，进程退出

综上步骤：

想要获取pending表或者更改block表的必备步骤是：

设置信号集
初始化信号集

信号的处理（信号处理时）

每个进程都有自己的地址空间和对应的页表，地址空间一般一共4G，3G的用户空间，而剩下的1G空间是内核空间，存储的是OS的数据和代码，且内核空间也有对应的内核页表映射到物理内存上，但是内核页表不管有多少个进程，都只共享一份；保证无论进程怎么切换，都能够找到同一个OS

进程是可以看到内核和用户的内容的，但是不一定能够访问，需要有权限来证明进程处于哪种工作模式，在进程里面是有对应的相关数据来标识进程的工作模式的（用户模式 / 内核模式）

想要访问内核数据，就需要切换至内核态
想要访问用户数据，就需要切换至用户态

这个数据会被加载到 CPU 的其中一个寄存器当中（CR3），用于保存当前进程是处于用户态还是处于内核态。

内核态：执行 OS 的代码和数据时所处的状态。OS 的代码的执行全部都是在内核态。
用户态：用户的代码和数据被访问或执行时所处的状态。也就是说我们写的代码全部都是在用户态执行的。

而系统调用就是：将进程切换至内核态去调用系统函数

信号是如何处理的？

信号是被保存在PCB中的pending位图里面，处理的工作分为检测、递达（默认、忽略、自定义），当进程从内核态返回到用户态的时候，进行信号的处理工作

处理的流程大致如下图所示：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RxIa9Pev-1677869450658)(G:\Typora\图片保存\image-20221220232624326.png)]$

抽象图：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XAH2ArSt-1677869450658)(G:\Typora\图片保存\image-20221220232732351.png)]$

为什么不能由OS直接执行捕捉函数方法？

要知道OS是不相信任何人的，handler方法是用户定义的，内核态只能执行OS的代码数据，所以首先再身份上就不合适。其次因为OS只相信自己，也就是只相信自己的代码和数据是安全的，假如handler的函数方法定义一些恶意代码，那么OS等于以它的权限去执行，造成安全隐患。所以OS要保护好自己

什么时候处理信号？从内核态切换回用户态的时候进行信号检测并处理

**当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字。**这样就保证了在处理某个信号时,如果这种信号再次产生,那么它（第二次）会被阻塞到当前处理结束为止

在 Linux 中，如果把进程的某一个普通信号屏蔽了，然后 OS 给这个进程多次发送该信号，该进程只能记住一次，因为记录信号的标记位只有一个比特位。也就是说，在 Linux 中，普通信号是可能会被丢失的。而实时信号不会被丢失，因为内核是以链表队列的形式把所有的实时信号组织起来的，来一个就链一个。（数据结构的差别）