目录
一、信号入门
1、用户输入命令,在shell下启动一个前台进程,用户按CTRL+C,这个键盘输入产生一个硬件中断,被OS获取,解释成信号,发送给目标前台程序,前台程序因为受到信号,进而程序退出。
2、注意:
CTRL+C产生的信号只能发给前台进程,一个命令后面加哥&可以放到后台运行,这样shell不必等待进程结束就可以接受新的命令,启动新的进程。
shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接收到像CTRL+C这种控制键产生的信号。
前台进程在运行过程中用户随时可能按下CTRL+C而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能受到SIGINT信号而终止,所以信号相对于进程的控制流程来说是异步的。
3、信号的概念
信号是进程之间事件异步通知的一种方式,属于软中断,本质是一种通知机制,用户或者OS通过发送一定的信号,通知进程某些事件已经发生,你可以在后续进行处理。
4、kill -l命令查看系统定义的信号列表
每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到
5、信号处理常见方式概览
可选的处理动作有以下三种:
1、忽略此信号
2、执行该信号的默认处理动作
3、提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉一个信号。
二、产生信号
1、通过中断按键产生信号
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且core Dump
什么是core Dump
当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘中,文件名通常是core,这叫做core Dump。进程异常终止通常是因为有bug,比如非法内存访问导致段错误事后可以用调试器检查core文件以查清错误原因。一个进程允许产生多大的core文件取决于进程的resource limit。默认是不允许产生core文件的。因为core文件中可能包含用户密码等敏感信息,不安全。
2、调用系统函数向进程发信号
kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。raise函数可以给当前进程发送指定的信号(自己给自己发送信号)
#include <signal.h>
int kill(pit_t pid, int signo);
int raise(int signo);
//这两个函数都是成功返回0,失败返回-1
3、由软件条件产生信号
#include <unistd.h>
unsigned int alarm(unsigned int seconds);
//调用alarm函数可以设定一个闹钟,告诉内核在seconds秒之后给当前进程发送SIGALRM信号,该信号的默认处理动作是终止当前进程
#include <iostream>
#include <string>
#include <vector>
#include <functional>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <signal.h>
#include <stdlib.h>
using namespace std;
typedef function<void ()> func;
vector<func> callbacks;
uint64_t count = 0;
void showCount()
{
cout << "final count: " << count << endl;
}
void showLog()
{
cout << "这是一个日志功能" << endl;
}
void logUser()
{
if(fork() == 0)
{
execl("/usr/bin/who", "who", nullptr);
exit(1);
}
wait(nullptr);
}
//定时器功能
void catchSig(int signum)
{
for(auto& f : callbacks)
{
f();
}
alarm(1);
}
int main(int argc, char *argv[])
{
signal(SIGALRM, catchSig);
alarm(1);
callbacks.push_back(showCount);
callbacks.push_back(showLog);
callbacks.push_back(logUser);
while(true) count++;
return 0;
}
上面的代码功能是,将SIGALRM信号重定义信号处理函数,改变后的函数是遍历调用vector中的函数,结果是每隔1s就会调用一遍vector中的函数。
4、硬件异常产生信号
硬件异常被硬件以某种凡是被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。
三、阻塞信号
1、信号其他相关常见概念
实际执行信号的处理动作称之为信号递达
信号从产生到递达之间的状态称为信号未决(pending)
进程可以选择阻塞(Block)某个信号
被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
注意阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作
2、在内核中的标识
每个信号都有两个标志位分别标识阻塞(block)和未决(pending),还有一个函数指针表示处理动作,信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。
如上图SIGINT信号产生,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生,一旦产生将被阻塞,它的处理动作是用户自定义的函数。
常规信号在递达之前产生多次只计一次。
3、sigset_t
从上图来看,每个信号只有一个bit的未决标志非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字,这里的“屏蔽”应该理解为阻塞而不是忽略。
4、信号集操作函数
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
#include <signal.h>
int sigemetyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset(sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismemeber(const sigset_t *set, int signo);
·函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号
·函数sigfillset初始化set所指向的信号机,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
·注意,在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以调用sigaddset和sigdelset在信号集中添加或删除某种有效信号。
这四个函数都是成功返回0出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含返回1,不包含返回0,出错返回-1。
5、sigprocmask
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
//返回值:若成功则返回0,若出错则返回-1
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how表示如何更改。如果oset和set都是非空指针,则将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。
SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set |
SIG_UNBLOCK | set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask&~set |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。
6、sigpending
#include <signal.h>
sigpending
//读取当前进程的未决信号集,通过set参数传出。调用成功返回0,出错返回-1.
四、捕捉信号
1、内核如何实现信号的捕捉
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,比如:用户程序注册了SIGQUIT信号的处理函数sighandler。当前正在执行main函数,这是发生中断或异常切换到内核态。在中断处理完毕之后要返回用户态的main函数之前检查到信号SIGQUIT递达。内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
2、sigaction
#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
sigaction函数可以读取和修改指定信号相关联的处理动作。调用成功则返回0,出错则返回-1。signo是指定信号的标号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体。
将sa_handler赋值为常数SIG_IGN传递给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这也是一个回调函数,不是被main函数调用,而是被系统所调用。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止,如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。