Linux进程信号

1. 信号的概念

前不久,我们刚了解过信号量,那么信号和信号量有关系吗?答案是,几乎没有任何关系,就和“老婆”和“老婆饼”一样,老婆饼里没有老婆,自然信号量里也没有信号了~

在现实生活中,有很多信号的栗子,比如红绿灯、下课铃声、狼烟(古代的烽火狼烟,说明外敌入侵了)、战争时候旗语、冲锋号、上班早晨的闹钟(头痛 ~ )等等,都是信号的象征,发出信号证明你该做点什么事儿了。

拿红绿灯来说吧

在小时候,父母或者老师一定给我们讲过如何识别红绿灯,于是自然而然的在我们心中形成一个印象,红灯行绿灯行,从此我们也就知道对应的灯亮,意味着什么,要做什么了。

信号没有产生的时候,其实我们已经知道怎么处理这个信号了!如果在等红绿灯出现点突发情况,比如遇见认识的人寒暄几句,那么我们看见红绿灯,就不一定会立即过马路了。所以说信号产生了,我们不一定要立即处理它,而是在合适的时候处理!并且我要有一种能力,将已经到来的信号,进行暂时的保存

  • 你在网上买了很多件商品,在等待不同商品快递的到来。但即便快递没有到来,你也知道快递来临时,你该怎么处理快递。也就是你能“识别快递”。
  • 当快递员到了你楼下,你也收到快递到来的通知,但是你正在打游戏,需5min之后才能去取快递。那么在在这5min之内,你并没有下去去取快递,但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行,可以理解成“在合适的时候去取”。
  • 在收到通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间,你并没有拿到快递,但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”。
  • 当你时间合适,顺利拿到快递之后,就要开始处理快递了。而处理快递一般方式有三种:1. 执行默认动作(幸福的打开快递,使用商品);2. 执行自定义动作(快递是零食,你要送给你你的女朋友);3. 忽略快递(快递拿上来之后,扔到地下,继续开一把,好真实哈哈)。
  • 快递到来的整个过程,对你来讲是异步的,你不能准确断定快递员什么时候给你打电话。

信号的到来,我们并不清楚具体是什么时候,信号的到来相对于我正在做的工作,是异步产生的!

在以上所说的“我/我们”就代表进程。

总结一下,什么叫做信号呢?信号是一种向目标进程发送通知消息的一种机制

2. 信号的产生

2.1 铺垫概念

用户输入命令,在Shell下启动一个前台进程。用户按下Ctrl+C ,这个键盘输入产生一个硬件中断,被OS获取,解释成信号,发送给目标前台进程。前台进程因为收到信号,进而引起进程退出

  • Ctrl+C产生的信号只能发给前台进程。一个命令后面加个&可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。
  • Shell可以同时运行一个前台进程任意多个后台进程,只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
  • OS会自动的把shell提到前台或者后台(比如当有一前台进程正在运行,shell自动就会变为后台运行)。前台进程不能暂停,如果被暂停了,该前台进程必须立即被放到后台。
  • 前台进程在运行过程中用户随时可能按下Ctrl+C而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步(Asynchronous)的。

一些命令:

  • ./XXXX &:让该可执行程序后台运行
  • jobs:查看后台进程
  • fg number:把任务编号为number的任务放到前台
  • Ctrl+Z:暂停一个前台进程,也就是把一个前台任务变成后台任务并暂停。
  • bg number:使编号为number的后台进程继续运行

OS怎么知道键盘什么时候有数据输入了呢?

如果采用轮询检测的方案是非常不可取的,因为连接计算机的硬件,如果每一个硬件都去轮询检测,那么CPU的性能会大打折扣。所以当键盘输入时,会向CPU发送一个中断信号,当CPU接收到这个中断信号,证明键盘有数据输入了!

信号的本质就是用软件来模拟中断的行为。

信号的处理动作有以下三种:

  1. 忽略此信号。
  2. 执行该信号的默认处理动作。
  3. 自定义捕捉信号,提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。(大部分信号都是可以自定义被捕捉的,只有少部分信号不可以,比如9号信号

如果我们想查到对于某种信号的默认处理动作,可以使用命令man 7 signal,向下翻找,就能看到:

image-20240627114756819

信号的产生:

  1. 由上知道,可以通过键盘进行信号的产生,Ctrl + C向前台进程发送2号信号;Ctrl + Z默认暂停前台进程,向前台进程发送20号信号;Ctrl + \默认终止进程,向前台进程发送3号信号。
  2. 通过系统调用产生

2.2 通过键盘产生信号

我们知道,Ctrl + C可以杀掉前台进程,同样的使用kill -2也可以杀掉当前进程,那么如何证明Ctrl + Ckill -2是等价的呢?此时需要用到一个signal函数

image-20240626171624759

搞段代码

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>

using namespace std;

void handler(int signo)
{
    cout << "获得一个2号信号, pid:" << getpid() << endl;
    exit(1);
}

int main()
{
    signal(2, handler);

    while (1)
    {
        cout << "running, pid:" << getpid() << endl;
        sleep(1);
    }
    return 0;
}

signal收到2号信号,转为指向handler函数的操作,下面就是实践出真知!

首先用Ctrl + C:

image-20240626174441671

再用kill命令

image-20240626174540110

如此,结果得证,Ctrl + Ckill -2是等价的。

kill -l命令查看系统定义的信号列表

image-20240626161956530

可以发现,在这么多的信号里,没有0号、32号和33号信号,1-31号信号属于普通信号,34-64号信号属于实时信号

每一个进程都有一张自己的函数指针数组,数组的下标和信号编号强相关。

对于普通信号来说,进程收到信号之后,进程要表示自己是否收到了某种信号

使用位图,比特位的位置,决定信号的编号;比特位的内容,决定是否收到信号。

OS向目标进程发信号,实际上就是OS向目标进程写信号,就是修改OS内的位图的标志位由0变为1,即完成了一次的信号的发送。

无论信号有多少种产生方式,永远只能由操作系统本身向目标进程发送!这是为什么捏?

因为OS是进程的管理者!

每个进程对于信号来说都有

  1. 函数指针数组
  2. 信号位图

2.3 通过系统调用产生信号

首先用man手册查看一下这个关于产生信号的系统调用kill

image-20240627142551403

来段代码演示一下用法

#include <iostream>
#include <string>
#incldue <sys/types.h>
#include <signal.h>

using namespace std;

static void Usage(const string &cd)
{
    cout << "please input:" << cd << " -signalnum process" << endl;
}
int main(int argc, char* argv[])
{
	if (argc != 3)
	{
		Usage(argv[0]);
	}
	
    int processid = stoi(argv[2]);
    int signalnum = stoi(argv[1] + 1);
    
    kill(processid, signalnum);
	
	return 0;
}

效果如下:

image-20240627155611345

可以很清楚的看到,使用命令之前,有父子进程一块运行,使用命令之后,子进程被杀掉了,只有父进程一个进程在孤独的运行。

kill函数是给任意进程发送任意信号。

再介绍一个新的函数,raise函数,给自己发送任意信号。

image-20240627160129152

再搞段代码验证一下:

#include <iostream>
#include <signal.h>

using namespace std;

void handler(int signo)
{
    cout << "获得一个" << signo << "号信号, pid:" << getpid() << endl;
}

int main()
{
    signal(2, handler);

    while (1)
    {
        raise(2);
        sleep(1); // 每隔一秒向自己发送2号信号
    }
    return 0;
}

现象如下:

image-20240627161234179

可以清楚的看到不论是自己发送的2号信号还是Ctrl + C都被拦截了。

还有一个系统调用,abort函数,使当前进程接收到6号信号而异常终止。

就像exit函数一样,abort函数总是会成功的,所以没有返回值。

image-20240627162032341

验证一下:

#include <iostream>
#include <stdlib.h>

using namespace std;

void handler(int signo)
{
    cout << "获得一个" << signo << "号信号, pid:" << getpid() << endl;
}

int main()
{
    signal(6, handler);

    abort();
    while (1)
    {
        cout << "I am running..." << endl;
        sleep(1);
    }
    return 0;
}

现象如下:

image-20240627163315411

abort函数发送的6号信号,概念得证,但是程序并没有像想象中的持续运行,而是依旧被终止掉了,说明6号信号也是一个不可被自定义捕捉的信号!

2.4 由异常(硬件)产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

首先是除零异常,会发送8号信号然后终止进程。

#include <iostream>
#include <stdlib.h>

using namespace std;

void handler(int signo)
{
    cout << "获得一个" << signo << "号信号, pid:" << getpid() << endl;
    sleep(1);
}

int main()
{
    signal(8, handler);

    int n = 10;
    n /= 0;
    
    return 0;
}

来看看现象:

image-20240627215552463

没有意外的的是,我们获取了8号信号,但是有个奇怪现象,这段代码通篇都没有循环,为什么一直在处理8号信号呢?

  • CPU内的寄存器属于硬件,但寄存器内的内容不属于CPU,而属于当前正在运行的进程,这个内容我们称之为当前进程的硬件上下文。
  • 当进程出现异常时,默认是终止这个进程的,把进程杀掉就是OS处理异常的手段之一。
  • 但是,我们的代码将这个异常信号给自定义捕捉了,并不再终止进程,这个异常会一直存在,所以只要CPU每次被调度,寄存器把上下文保存并恢复时,就会一直提示操作系统出现异常,并把异常转化为信号发送给进程,也就是给了自定义捕捉,就只会打印一句话,而不会终止,如此循环往复。(语文功底有点差,感觉说的有点点绕,见谅!T^T)

紧接着的异常是访问野指针问题,会发生段错误,会发送11号信号然后终止进程。

(具体现象和除零异常差不多~这里不再赘述)

最后说一个结论:

产生信号的方式可以有很多种,但是发送信号只能由操作系统来发!

2.5 由软件条件产生信号

SIGPIPE是一种由软件条件产生的信号,在“管道”中已经介绍过了。这里主要介绍alarm函数 和SIGALRM信号。

在Linux中是可以设置闹钟的,就和现实生活中的闹钟一样,在规定时间提醒你。

image-20240628105522871

  • 调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发14号(SIGALRM)信号,该信号的默认处理动作是终止当前进程。
  • 返回值:0或者是以前设定的闹钟时间还余下的秒数。
  • 打个比方,某人要小睡一觉,设定闹钟为30分钟之后响,20分钟后被人吵醒了,还想多睡一会儿,于是重新设定闹钟为15分钟之后响,“以前设定的闹钟时间还余下的时间”就是10分钟。如果seconds值为0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数。

3. 信号的保存

3.1 信号其他相关常见概念

  • 实际执行信号的处理动作称为信号递达(Delivery)。
  • 信号从产生到递达之间的状态,也就是你的信号在那张信号位图时,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号。效果就是未决之后,暂时不进行递达,直到解除对信号的阻塞。
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
  • 注意,阻塞忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

在上面我们讲述过,处理信号的方式有三种:

  1. 忽略信号(就是处理信号,并不是字面意思给他忽略了!)
  2. 执行默认动作
  3. 自定义捕捉信号

image-20240629120347843

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
  • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次
  • Linux是这样实现的:常规信号在递达之前产生多次只记录一次,而实时信号在递达之前产生多次可以依次放在一个队列里。把接收到的信号只记录一次的,这种机制的信号我们称之为普通信号也就是常规信号。
  • 从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

3.2 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。

#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
  • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
  • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置1,表示该信号集的有效信号包括系统支持的所有信号。
  • 注意,在使用sigset_ t类型的变量之前,一定要调用sigemptysetsigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddsetsigdelset在该信号集中添加或删除某种有效信号。

这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

  • 调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

image-20240630150348237

  • #include <signal.h>
  • int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
  • 返回值:若成功则为0,若出错则为-1。

oset返回的是老的block表的位图。如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果osetset都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据sethow参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下面说明了how参数的可选值。

  • SIG_BLOCK:set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask = make | set
  • SIG_UNBLOCK:set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask = mask$~set
  • SIG_SETMASK:设置当前信号屏蔽字为set所指向的值,相当于mask = set

如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。

  • 调用函数sigpending获取pending表

image-20240630154305303

读取当前进程的未决信号集,通过set参数传出。

  • #include <signal.h>
  • int sigpending(sigset_t *set);
  • 返回值:调用成功则返回0,出错则返回-1。

在信号处理之前,pending中的数字就由1置为0了。

4. 信号的处理

信号在合适的时候被处理,就是进程从内核态返回到用户态的时候,进行信号的检测和信号的处理。

用户态是种受控的状态,能够访问的资源是有限的;而内核态是一种操作系统的工作状态,能够访问大部分的系统资源。系统调用的背后就包含了身份的变化!就如同曾经的库函数调用一样,调用系统调用接口,也是在进程的地址空间中进行的!

无论进程如何调度,cpu都可以直接找到OS!

我们的进程的所有代码的执行,都可以在自己的地址空间内通过跳转的方式,进行调用和返回!!

4.1 内核如何实现信号的捕捉

如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下:用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandlermain函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

接下来介绍sigaction函数

image-20240701114601454

  • sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。actoact指向sigaction结构体
  • sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,0这也是一个回调函数,不是被main函数调用,而是被系统所调用。

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,这里不做深入了解。

5. 信号的其他补充问题

5.1 可重入函数

main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的 时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换 到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的 两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后 向链表中插入两个节点,而最后只有一个节点真正插入链表中了。

image-20240701154330024

像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数。反之,如果一个函数只访问自己的局部变量或参数,允许被多个执行路重复进入,则称为可重入(Reentrant) 函数

可重入和不可重入描述的是一种函数的特征

5.2 volatile

volatile的作用:保持内存的可见性

搞段代码

#include <iostream>
#include <unistd.h>

using namespace std;

int flag = 0;
void handler(int signo)
{
	cout << "signo is " << signo << endl;
	flag = 1;
	cout << "flag is changed!" << endl;
}

int main()
{
	signal(2, handler);
	cout << "pid:" << getpid() << endl;
	while (true);
	cout << "quit normally!" << endl;
	return 0;
}

运行一下,观察现象:

image-20240701165222015

O1优化情况下,键入CTRL+C,2号信号被捕捉,执行自定义动作,修改flag=1,但是while 条件依旧满足,进程继续运行!不过很明显,flag肯定已经被修改了,但是为何循环依旧执行?

很明显, while 循环检查的flag,并不是内存中最新的flag,这就存在了数据二异性的问题。while 检测的flag其实已经因为优化,被放在了CPU寄存器当中。如何解决呢?很明显需要volatile。只要在定义flag之前加上volatile即可,volatile int flag = 0;。从此以往,所有关于flag的操作,都要从内存中拿取

5.3 SIGCHLD信号

子进程在退出的时候,并不是什么都没告知进程的,而是给父进程发送SIGCHLD信号的。

  • 进程一章讲过用waitwaitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
  • 其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
  • 事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigactionSIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略 通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。
  • 16
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值