【Linux】初识信号与信号产生

何陈陈

已于 2024-09-17 11:19:14 修改

阅读量460

点赞数 8

分类专栏： Linux 文章标签： linux 运维服务器

于 2024-09-17 11:12:31 首次发布

本文链接：https://blog.csdn.net/2301_77438812/article/details/142064487

版权

Linux 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

一、认识信号

1 .什么是信号

你在网上买了很多件商品，再等待不同商品快递的到来。但即便快递没有到来，你也知道快递来临时，你该怎么处理快递。也就是你能“ 识别快递 ”

当快递员到了你楼下，你也收到快递到来的通知，但是你正在打游戏，需5min 之后才能去取快递。那么在在这5min 之内，你并没有下去去取快递，但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行，可以理解成“ 在合适的时候去取 ” 。

在收到通知，再到你拿到快递期间，是有一个时间窗口的，在这段时间，你并没有拿到快递，但是你知道有一个快递已经来了。本质上是你“ 记住了有一个快递要去取 ”

当你时间合适，顺利拿到快递之后，就要开始处理快递了。

而处理快递一般方式有三种：

1. 执行默认动作（幸福的打开快递，使用商品）

2. 执行自定义动作（快递是零食，你要送给你你的女朋友）

3. 忽略快递（快递拿上来之后，扔掉床头，继续开一把游戏）

快递到来的整个过程，对你来讲是异步的，你不能准确断定快递员什么时候给你打电话

而在linux中，信号是：

Linux系统提供的一种，向指定进程发送特定事件的方式，做识别和处理。信号的产生是异步的。

信号是进程之间事件异步通知的一种方式，属于软中断。

2 .哪些情况会产生信号

①键盘事件，如：ctl c 、ctl \
②访问非法内存
③硬件出现故障
④用户态到内核态的切换

3 . 查看信号

用kill -l命令

每个信号都有一个编号和一个宏定义名称 , 这些宏定义可以在 signal.h 中找到 , 例如其中有定义 #define SIGINT 2

编号 34 以上的是实时信号 , 本章只讨论编号 34 以下的信号 , 不讨论实时信号。这些信号各自在什么条件下产生, 默认的处理动作是什么 , 在 signal(7) 中都有详细说明 : man 7 signal

4 . 信号处理

当收到信号后常用三种方式进行处理：

①忽略：收到信号后，不处理
SIGKILL和SIGSTOP是不可能被忽略的
②捕获并处理：收到信号后，执行我们自己写的代码
SIGKILL和SIGSTOP不能捕获
③默认处理方式

二、产生信号

1 .通过终端按键产生信号

SIGINT 的默认处理动作是终止进程 ,SIGQUIT 的默认处理动作是终止进程并且Core Dump

Core Dump（核心转储）：

当一个进程要异常终止时 , 可以选择把进程的 用户空间内存数据 全部保存到磁盘上, 文件名通常是 core, 这叫做 Core Dump 。进程异常终止通常是因为有 Bug, 比如非法内存访问导致段错误 ,

事后可以用调试器检查 core 文件以查清错误原因 , 这叫做 Post-mortem Debug （事后调试）。一个进程允许产生多大的core 文件取决于进程的 Resource Limit( 这个信息保存在 PCB 中 ) 。 默认是不允许产生core文件 的 ,因为core 文件中可能包含用户密码等敏感信息 , 不安全。在开发调试阶段可以用 ulimit命令 改变这个限制 , 允许产生core 文件。首先用 ulimit 命令改变 Shell 进程的 Resource Limit, 允许 core 文件最大为 1024K 命令： ulimit -c 10240

当core文件的大小设置完毕后，就相当于将核心转储功能打开了。此时如果我们再使用Ctrl+\对进程进行终止，就会发现终止进程后会显示core dumped。

当我们使用ctrl+‘\’终止时，打开了core dump与没打开终止是不一样的。

他会多一个括号，后面表明core dumped。

同时会在当前进程默认路劲生成一个core的文件（不同系统下生成的文件名可能会有一些不一样）

说明一下： ulimit命令改变的是Shell进程的Resource Limit，但myproc进程的PCB是由Shell进程复制而来的，所以也具有和Shell进程相同的Resource Limit值。

core文件的使用

当我们的代码出错了，我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了，那么我们可以通过退出码来判断代码出错的原因，而如果一个代码是在运行过程中出错的，那么我们也要有办法判断代码是什么原因出错的。

当我们的程序在运行过程中崩溃了，我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下，我们会用到核心转储，核心转储指的是操作系统在进程收到某些信号而终止运行时，将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中，这个磁盘文件也叫做核心转储文件，一般命名为core.pid。

而核心转储的目的就是为了在调试时，方便问题的定位。这也叫事后调试

使用core-file 文件名就可以找到出问题的地方：

core dump标志

前面我们学习了waitpid（）命令

pid_t waitpid(pid_t pid, int *status, int options);

他的第二个参数status是一个输出型参数，用于获取子进程的退出状态。status是一个整型变量，但status不能简单的当作整型来看待，status的不同比特位所代表的信息不同，具体细节如下（只关注status低16位比特位）：

若进程是正常终止的，那么status的 次低8位就表示进程的退出状态，即 退出码。若进程是被信号所杀，那么status的 低7位表示终止信号，而 第8位比特位是core dump标志，即进程终止时是否进行了核心转储。

打开Linux的核心转储功能，并编写下列代码。代码中父进程使用fork函数创建了一个子进程，子进程所执行的代码当中存在野指针问题，当子进程执行到*p = 100时，必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态，根据status的第7个比特位便可得知子进程在被终止时是否进行了核心转储。

运行起来：

status的第七位为1，说明子进程在终止的时候发生了核心转储。

所以，core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。

接下来我们通过以下代码，将1~31号信号全部进行捕捉，将收到信号后的默认处理动作改为打印收到信号的编号。

当我们kill -9 xxx的时候，发现并没有打印信号，而是终止了进程。

说明： 有些信号是不能被捕捉的，比如9号信号。因为如果所有信号都能被捕捉的话，那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略，此时该进程将无法被杀死，即便是操作系统。

这样就会出现漏洞。

注意：

2 .调用系统函数向进程发信号

当我们要使用kill命令向一个进程发送信号时，我们可以通过kill -信号名（信号编号）进程ID的形式进行发送。

kill函数用于向进程ID为pid的进程发送sig号信号，如果信号发送成功，则返回0，否则返回-1。

函数原型：

模拟实现kill命令：

int main(int argc ,char *argv[])
{
    if(argc!=3)
    {
        std::cout<<argv[0]<<std::endl;
    }
    pid_t pid=std::stoi(argv[1]);
    int signo=std::stoi(argv[2]);
    kill(pid,signo);
    
    return 0;
}

写一个程序捕捉所有信号，然后死循环。用键盘ctrl+c/ctrl+\ 和mykill程序去终止这个死循环程序。

结果我们发现，捕捉了的信号收到时都会执行我们自己设定的程序，而不能被捕捉的9号信号则能终止进程。

为了使我们能不带路径，我们可以将当前可执行文件mykill 导入到环境变量，当然我们只是导入到内存级环境变量，下一次登陆就会消失，但是这一次我们可以使用。

我们除了用外部方式发送信号，还可以程序自己给自己发送信号，比如说用

raise函数：

raise函数是给进程发送一个信号，就是自己给自己发信号，发送成功返回0，发送失败返回一个非零的数。

下面代码是将2号信号捕捉，然后执行每隔一秒向进程发送一个2号信号：

void handler(int signo)
{
    std::cout << "get a sig : " << signo <<"  pid : "<<getpid()<< std::endl;
}
int main()
{
    signal(2, handler);
    while (true)
    {
        sleep(1);
        raise(2);
    }
    return 0;
}

执行结果：

另外，还有其他的函数可以向进程发送信号比如说

abort函数：

void abort(void);

abort函数是一个无参数无返回值的函数。

例如，下列代码当中每隔一秒向当前进程发送一个SIGABRT信号。

void handler(int signo)
{
    std::cout << "get a sig : " << signo <<"  pid : "<<getpid()<< std::endl;
}
int main()
{
    signal(6, handler);
    while (true)
    {
        sleep(1);
        abort();
    }
    return 0;
}

与之前不同的是，虽然我们对SIGABRT信号进行了捕捉，并且在收到SIGABRT信号后执行了我们给出的自定义方法，但是当前进程依然是异常终止了。

这是因为，SIGABRT信号允许我们捕捉执行自定义函数，但是他依然要执行终止函数。他是进程异常终止函数。他会在执行了自定义程序之后再执行进程异常终止

注意一下这里还有一个exit函数也是终止程序，但是他两个不一样。exit函数终止程序的时候他会执行一系列回收释放操作，比如说调用析构函数释放资源。而abort函数是直接异常终止程序，马上停止，由操作系统直接回收资源。

虽然两个都是操作系统回收，但是abort可能会导致正在i/o的资源发生数据丢失等问题。

3 . 由软件条件产生信号

SIGPIPE信号

SIGPIPE信号实际上就是一种由软件条件产生的信号，当进程在使用管道进行通信时，读端进程将读端关闭，而写端进程还在一直向管道写入数据，那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。

SIGALRM信号

调用alarm函数可以设定一个闹钟，也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程，alarm函数的函数原型如下：

alarm函数的作用：

让操作系统在seconds秒之后给当前进程发送SIGALRM信号，SIGALRM信号的默认处理动作是终止进程。

alarm函数的返回值：

若在调用alarm函数前，进程已经设置了闹钟，则返回上一个闹钟时间的剩余时间，并且本次闹钟的设置会覆盖上一次闹钟的设置。
如果调用alarm函数前，进程没有设置闹钟，则返回值为0。

用这个函数我们就可以知道我们当前系统在规定时间内能允许多少次加减法。

如下代码：

int main()
{
    alarm(1);
    int cnt=0;
    while(true) 
    {
        cnt++;
        std::cout<<" cnt : "<<cnt<<std::endl;
    }
    return 0;
}

运行结果：

可以知道我当前的系统，一秒能后置加加并打印40904次。

当然我们还能通过代码知道不打印只加加，一秒能完成多少次

代码：

int cnt=1;
void handler(int sig)
{
    std::cout<<"get a sig: "<<sig<<" cnt: " <<cnt<<std::endl;
    exit(0);
}
int main()
{
    signal(SIGALRM,handler);
    alarm(1);
    while(cnt++);
    return 0;
}

运行结果：

可以看见，一秒时间加加能运行6亿多次

实际上我当前的云服务器在一秒内可以执行的累加次数远大于两万，那为什么上述代码运行结果比实际结果要小呢？

由于我们每进行一次累加就进行了一次打印操作，而与外设之间的IO操作所需的时间要比累加操作的时间更长。

因此可以看出系统i/o的效率是比较低的。

4 . 由硬件异常产生信号

程序崩溃

为什么程序会崩溃？

当我们程序当中出现类似于除0、野指针、越界之类的错误时，为什么程序会崩溃？本质上是因为进程在运行过程中由于非法访问等操作收到了操作系统发来的信号进而被终止，那操作系统是如何识别到一个进程触发了某种问题的呢？

这就需要我们带入一点点硬件知识了。

我们知道，CPU当中有一堆的寄存器，当我们需要对两个数进行算术运算时，我们是先将这两个操作数分别放到两个寄存器当中，然后进行算术运算并把结果写回寄存器当中。

此外，CPU当中还有一组寄存器叫做状态寄存器，它可以用来标记当前指令执行结果的各种状态信息，如有无进位、有无溢出等等。

而操作系统是软硬件资源的管理者，在程序运行过程中，若操作系统发现CPU内的某个状态标志位的溢出标记位被置为1。而这次置位就是因为出现了某种除0等错误而导致的，那么此时操作系统就会马上识别到当前是哪个进程导致的该错误，并将所识别到的硬件错误包装成信号发送给目标进程。

这里我们通过查询知道除0错误是8号信号

那么本质就是操作系统去直接找到这个进程的task_struct，并向该进程的位图中写入8号信号，写入8号信号后这个进程就会在合适的时候被终止。

然后再谈下面的野指针问题，或者越界访问的问题时，操作系统又是如何识别到的呢？

int main()
{
	printf( "I am running. . .\n" );
	sleep(3);
	int *p = NULL;
	*p = 100;
	return 0;
}

这里我们依然需要带入一点点硬件知识。

前面我们认识了页表.我们知道的是，当我们要访问一个变量时，要先经过页表的映射，将虚拟地址转换成物理地址，然后才能进行一些相应的访问操作

这里我们还需要认识两个寄存器：

其中页表属于一种软件映射关系，而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU，它是一种负责处理CPU的内存访问请求的计算机硬件，因此映射工作不是由CPU做的，而是由MMU和CR3寄存器一起做的，现在MMU已经集成到CPU当中了。

当需要进行虚拟地址到物理地址的映射时，我们先将页表的左侧的虚拟地址导给MMU，然后MMU会计算出对应的物理地址，我们再通过这个物理地址进行相应的访问。

而MMU既然是硬件单元，那么它当然也有相应的状态信息，当我们要访问不属于我们的虚拟地址时，MMU在进行虚拟地址到物理地址的转换时就会出现错误，然后将对应的错误写入到自己的状态信息——CR2当中，这时CR2上面的信息也会立马被操作系统识别到，进而将对应进程发送SIGSEGV信号。

何陈陈

关注

8
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录