Linux 系统编程实用手册（六）

原文：zh.annas-archive.org/md5/9713B9F84CB12A4F8624F3E68B0D4320

译者：飞龙

协议：CC BY-NC-SA 4.0

第十二章：信号处理 - 第 II 部分

如前一章所述，信号是 Linux 系统开发人员理解和利用的关键机制。前一章涵盖了几个方面：介绍，为什么信号对系统开发人员有用，以及最重要的是，开发人员如何处理和利用信号机制。

本章将继续探讨这一问题。在这里，我们将深入研究使用信号处理进程崩溃的内部细节，如何识别和避免处理信号时的常见问题，处理实时信号，发送信号，以及最后，执行信号处理的替代方法。

在本章中，读者将学到以下内容：

优雅地处理进程崩溃，并在那时收集有价值的诊断信息
处理与信号相关的常见陷阱——errno 竞争，正确的睡眠方式（是的，你没看错！）
处理强大的实时信号
向其他进程发送信号，并通过信号执行 IPC
替代信号处理技术

优雅地处理进程崩溃

应用程序中导致运行时崩溃的错误？天啊，这怎么可能？

不幸的是，对于经验丰富的软件老手来说，这并不是一个大惊喜。错误存在；它们有时可以很好地隐藏多年；有一天，它们会出现，然后*砰！*进程崩溃了。

在这里，我们的意图不是讨论调试技术或工具（也许我们可以把这个留到另一本书中吧？）；相反，关键是：如果我们的应用程序进程崩溃了，我们能做些什么？当然可以：在上一章中，我们已经详细学习了如何捕获信号。为什么不设计我们的应用程序，使我们捕获典型的致命信号——SIGBUS、SIGFPE、SIGILL 和 SIGSEGV，并在它们的信号处理程序中执行有用的任务，比如：

执行关键应用程序清理——例如，释放内存区域，刷新和关闭打开的文件等
将相关详细信息写入日志文件（导致崩溃的信号，信号的来源，原因，CPU 寄存器值等）
通知最终用户，嘿，太糟糕了，我们崩溃了
请允许我们收集崩溃详细信息，我们下次会做得更好，我们保证！

这不仅为我们提供了有价值的信息，可以帮助您调试崩溃的根本原因，而且还可以使应用程序优雅地退出。

使用 SA_SIGINFO 详细信息

让我们回顾一下我们在上一章中看到的sigaction结构的第一个成员，信号处理 - 第 I 部分，sigaction 结构部分；它是一个函数指针，它指定了信号处理程序：

struct sigaction
  {
    /* Signal handler. */
#ifdef __USE_POSIX199309
    union
      {
        /* Used if SA_SIGINFO is not set. */
 __sighandler_t sa_handler;
 /* Used if SA_SIGINFO is set. */
 void (*sa_sigaction) (int, siginfo_t *, void *); 
      } 
    __sigaction_handler;
# define sa_handler __sigaction_handler.sa_handler
# define sa_sigaction __sigaction_handler.sa_sigaction
#else
    __sighandler_t sa_handler;
#endif
 *--snip--* };

前面突出显示的代码突出显示了，由于它在一个联合中，信号处理程序可以是以下之一：

sa_handler：当清除SA_SIGINFO标志时
sa_sigaction：当设置了SA_SIGINFO标志时

到目前为止，我们已经使用了sa_handler风格的信号处理程序原型：

void (*sa_handler)(int);

它只接收一个参数：发生的信号的整数值。

如果您设置了**SA_SIGINFO**标志（当然，在发出sigaction(2)系统调用时），信号处理程序函数原型现在变成了这样：void (*sa_sigaction)(int, siginfo_t *, void *);

参数如下：

发生的信号的整数值
一个指向siginfo_t类型的结构的指针（显然是一个 typedef）
一个仅供内部使用的（未记录的）指针称为ucontext

第二个参数是关键所在！

siginfo_t 结构

当您使用SA_SIGINFO信号标志并发生受困信号时，内核会填充一个数据结构：siginfo_t结构。

下面显示了siginfo_t结构定义（稍微简化；在前几个成员周围有一些#if包装，我们在这里不需要担心）（在 Ubuntu 的头文件/usr/include/x86_64-linux-gnu/bits/types/siginfo_t.h中，Fedora 的头文件为/usr/include/bits/types/siginfo_t.h）：

typedef struct {
    int si_signo; /* Signal number. */
    int si_code;  
    int si_errno; /* If non-zero, an errno value associated with
           this signal, as defined in <errno.h>. */

    union
    {
         int _pad[__SI_PAD_SIZE];
        /* kill(). */
         struct
         {
             __pid_t si_pid; /* Sending process ID. */
             __uid_t si_uid; /* Real user ID of sending process. */
         } _kill;

        /* POSIX.1b timers. */
         struct
         {
             int si_tid; /* Timer ID. */
             int si_overrun; /* Overrun count. */
             __sigval_t si_sigval; /* Signal value. */
         } _timer;

        /* POSIX.1b signals. */
         struct
         {
             __pid_t si_pid; /* Sending process ID. */
             __uid_t si_uid; /* Real user ID of sending process. */
             __sigval_t si_sigval; /* Signal value. */
         } _rt;

        /* SIGCHLD. */
         struct
         {
             __pid_t si_pid; /* Which child. */
             __uid_t si_uid; /* Real user ID of sending process. */
             int si_status; /* Exit value or signal. */
             __SI_CLOCK_T si_utime;
             __SI_CLOCK_T si_stime;
         } _sigchld;

        /* SIGILL, SIGFPE, SIGSEGV, SIGBUS. */
         struct
         {
           void *si_addr; /* Faulting insn/memory ref. */
           __SI_SIGFAULT_ADDL
           short int si_addr_lsb; /* Valid LSB of the reported address. */
           union
           {
              /* used when si_code=SEGV_BNDERR */
              struct
              {
                 void *_lower;
                 void *_upper;
              } _addr_bnd;
              /* used when si_code=SEGV_PKUERR */
              __uint32_t _pkey;
           } _bounds;
         } _sigfault;

        /* SIGPOLL. */
        struct
        {
             long int si_band; /* Band event for SIGPOLL. */
             int si_fd;
         } _sigpoll;

        /* SIGSYS. */
#if __SI_HAVE_SIGSYS
         struct
         {
             void *_call_addr; /* Calling user insn. */
             int _syscall; /* Triggering system call number. */
             unsigned int _arch; /* AUDIT_ARCH_* of syscall. */
         } _sigsys;
#endif
    } _sifields;
} siginfo_t ;

前三个成员是整数：

si_signo : 信号编号 - 传递给进程的信号
si_code : 信号来源；一个枚举；典型值如下：

SI_QUEUE : 由sigqueue(3)发送

SI_USER : 由kill(2)发送

SI_KERNEL : 由内核发送

SI_SIGIO : 由排队的 SIGIO 发送

SI_ASYNCIO : 由 AIO 完成发送

SI_MESGQ : 由实时消息队列状态更改发送

SI_TIMER : 由定时器到期发送

si_errno : （如果非零）errnovalue

这里真正有趣的部分是：结构的第四个成员是七个结构的union（_sifields）。我们知道union意味着在运行时将实例化任何一个成员：它将是七个结构中的一个，具体取决于接收到哪个信号！

看一下之前显示的siginfo_t结构中的union；union中的注释非常清楚地指出了哪些信号将导致在运行时实例化哪个数据结构。

例如，我们在union中看到，当接收到SIGCHLD信号时，将填充此结构（也就是说，当子进程死亡、停止或继续时）：

 /* SIGCHLD. */
 struct
 {
     __pid_t si_pid; /* Which child. */
     __uid_t si_uid; /* Real user ID of sending process. */
     int si_status; /* Exit value or signal. */
     __SI_CLOCK_T si_utime;
     __SI_CLOCK_T si_stime;
 } _sigchld;

信息是关于子进程的；因此，我们接收到了进程的 PID 和真实 UID（除非使用了SA_NOCLDWAIT标志，当然）。此外，我们接收到整数位掩码si_status告诉我们子进程究竟是如何死亡的（等等）。还有一些审计信息，si_utime和si_stime，子进程在用户空间和内核空间中所花费的时间。

回想一下我们在第十章中的详细讨论，进程创建，等待 API - 详细信息部分*，*我们可以通过（任何）waitAPI 获取子进程终止状态信息。好吧，在这里，我们可以看到，更简单：使用SA_SIGINFO标志，捕获SIGCHLD信号，并且在处理程序函数中，只需从union中查找相关值！

sigaction(2)的手册详细描述了siginfo_t结构的成员，提供了详细信息。务必仔细阅读。

在进程崩溃时获取系统级细节

当进程通过SIGSEGV死亡时，可以从内核中获取大量信息：内存错误或缺陷，这是一个常见情况，正如我们在第四章中讨论的那样，动态内存分配，第五章，Linux 内存问题和第六章，内存问题的调试工具。（本节也适用于致命信号SIGBUS，SIGILL和SIGFPE。顺便说一句，SIGFPE不仅在除以零错误时发生，而且在任何与算术相关的异常中都会发生）。

在sigaction(2)的手册中揭示了以下信息：

...
The following values can be placed in si_code for a SIGSEGV signal:

SEGV_MAPERR
    Address not mapped to object.
SEGV_ACCERR
    Invalid permissions for mapped object.
SEGV_BNDERR (since Linux 3.19)
    Failed address bound checks.
SEGV_PKUERR (since Linux 4.6)
    Access was denied by memory protection keys. See pkeys(7). The  
    protection key which applied to this access is available via si_pkey.
...

SEGV_MAPERR表示进程试图访问的地址（读取、写入或执行）无效；要么没有可用于它的页表项（PTE）条目，要么它拒绝映射到任何有效地址。

SEGV_ACCERR很容易理解：尝试访问（读取、写入或执行）无法执行，因为缺少权限（例如，尝试写入只读内存页）。

奇怪的是，SEGV_BNDERR和SEGV_PKUERR宏无法编译；我们不会在这里尝试使用它们。

glibc 库提供了辅助例程psignal(3)和psiginfo(3)；传递一个信息字符串，它们会打印出来，然后是实际发生的信号以及有关信号传递和故障地址的信息（分别从 siginfo_t 结构中查找）。我们在示例代码中使用psiginfo(3)如下。

捕获并提取崩溃信息

接下来，我们将看到一个测试程序ch12/handle_segv.c，其中包含故意的错误，以帮助我们理解可能的用例。所有这些都将导致 OS 生成SIGSEGV信号。应用程序开发人员如何处理这个信号很重要：我们演示了如何使用它来收集重要的细节，例如发生崩溃的内存位置的地址以及那时所有寄存器的值。这些细节通常提供有用的线索，可以解释内存错误的根本原因。

为了帮助理解我们如何构建这个程序，可以不带任何参数运行它：

$ ./handle_segv 
Usage: ./handle_segv u|k r|w
u => user mode
k => kernel mode
 r => read attempt
 w => write attempt
$

可以看到，我们可以执行四种类型的无效内存访问：实际上，有四种错误情况：

无效用户[u]模式读[r]
无效用户[u]模式写[w]
内核无效[k]模式读[r]
无效内核[k]模式写[w]

我们使用的一些 typedef 和宏如下：

typedef unsigned int u32;
typedef long unsigned int u64;

#define ADDR_FMT "%lx"
#if __x86_64__ /* 64-bit; __x86_64__ works for gcc */
 #define ADDR_TYPE u64
 static u64 invalid_uaddr = 0xdeadfaceL;
 static u64 invalid_kaddr = 0xffff0b9ffacedeadL;
#else
 #define ADDR_TYPE u32
 static u32 invalid_uaddr = 0xfacedeadL;
 static u32 invalid_kaddr = 0xdeadfaceL;
#endif

main函数如下所示：

int main(int argc, char **argv)
{
 struct sigaction act;
 if (argc != 3) {
     usage(argv[0]);
     exit(1);
 }

 memset(&act, 0, sizeof(act));
 act.sa_sigaction = myfault;
 act.sa_flags = SA_RESTART | SA_SIGINFO;
 sigemptyset(&act.sa_mask);
 if (sigaction(SIGSEGV, &act, 0) == -1)
     FATAL("sigaction SIGSEGV failed\n");

if ((tolower(argv[1][0]) == 'u') && tolower(argv[2][0] == 'r')) {
   ADDR_TYPE *uptr = (ADDR_TYPE *) invalid_uaddr;
   printf("Attempting to read contents of arbitrary usermode va uptr = 0x" 
             ADDR_FMT ":\n", (ADDR_TYPE) uptr);
   printf("*uptr = 0x" ADDR_FMT "\n", *uptr); // just reading

 } else if ((tolower(argv[1][0]) == 'u') && tolower(argv[2][0] == 'w')) {
    ADDR_TYPE *uptr = (ADDR_TYPE *) & main;
    printf
    ("Attempting to write into arbitrary usermode va uptr (&main actually) = 0x" ADDR_FMT ":\n", (ADDR_TYPE) uptr);
    *uptr = 0x2A; // writing 
 } else if ((tolower(argv[1][0]) == 'k') && tolower(argv[2][0] == 'r')) {
    ADDR_TYPE *kptr = (ADDR_TYPE *) invalid_kaddr;
    printf
 ("Attempting to read contents of arbitrary kernel va kptr = 0x" ADDR_FMT ":\n", (ADDR_TYPE) kptr);
    printf("*kptr = 0x" ADDR_FMT "\n", *kptr); // just reading

 } else if ((tolower(argv[1][0]) == 'k') && tolower(argv[2][0] == 'w')) {
    ADDR_TYPE *kptr = (ADDR_TYPE *) invalid_kaddr;
    printf
 ("Attempting to write into arbitrary kernel va kptr = 0x" ADDR_FMT ":\n",
      (ADDR_TYPE) kptr);
    *kptr = 0x2A; // writing
 } else
     usage(argv[0]);
 exit(0);
}

va = 虚拟地址。

这是关键部分：SIGSEGV 的信号处理程序：

static void myfault(int signum, siginfo_t * si, void *ucontext)
{
  fprintf(stderr,
    "%s:\n------------------- FATAL signal ---------------------------\n",
    APPNAME);
    fprintf(stderr," %s: received signal %d. errno=%d\n"
 " Cause/Origin: (si_code=%d): ",
         __func__, signum, si->si_errno, si->si_code);

 switch (si->si_code) {
     /* Possible values si_code can have for SIGSEGV */
 case SEGV_MAPERR:
     fprintf(stderr,"SEGV_MAPERR: address not mapped to object\n");
     break;
 case SEGV_ACCERR:
     fprintf(stderr,"SEGV_ACCERR: invalid permissions for mapped object\n");
     break;
 /* SEGV_BNDERR and SEGV_PKUERR result in compile failure? */

 /* Other possibilities for si_code; here just to show them... */
 case SI_USER:
     fprintf(stderr,"user\n");
     break;
 case SI_KERNEL:
     fprintf(stderr,"kernel\n");
     break;
 *--snip--*

 default:
     fprintf(stderr,"-none-\n");
 }
<...>

    /* 
     * Placeholders for real-world apps:
     * crashed_write_to_log();
     * crashed_perform_cleanup();
     * crashed_inform_enduser();
     *
     * Now have the kernel generate the core dump by:
     *  Reset the SIGSEGV to (kernel) default, and,
     *  Re-raise it!
     */
    signal(SIGSEGV, SIG_DFL);
    raise(SIGSEGV);
}

这里有很多要观察的地方：

我们打印出信号编号和原始值
我们通过switch-case解释信号的原始值
特别是对于 SIGSEGV，SEGV_MAPERR 和 SEGV_ACCERR

接下来是有趣的部分：以下代码打印出故障指令或地址！不仅如此，我们设计了一种方法，通过它我们可以通过我们的dump_regs函数打印出大部分 CPU 寄存器。正如前面提到的，我们还使用辅助例程psiginfo(3)如下：

fprintf(stderr," Faulting instr or address = 0x" ADDR_FMT "\n",
         (ADDR_TYPE) si->si_addr);
fprintf(stderr, "--- Register Dump [x86_64] ---\n");
dump_regs(ucontext); fprintf(stderr,
     "------------------------------------------------------------\n");
psiginfo(si, "psiginfo helper");
fprintf(stderr,
     "------------------------------------------------------------\n");

然后，我们只保留了一些虚拟存根，用于处理这种致命信号在真实世界应用程序中可能需要的功能（在这里，我们实际上没有编写任何代码，因为这当然是非常特定于应用程序的）：

/* 
 * Placeholders for real-world apps:
 * crashed_write_to_log();
 * crashed_perform_cleanup();
 * crashed_inform_enduser();
 */

最后，调用abort(3)使进程终止（因为它现在处于未定义状态，无法继续）是一种结束的方式。然而，请思考一下：如果我们现在abort()，进程将在内核有机会生成核心转储的情况下死亡。（如前所述，核心转储实质上是进程在崩溃时的动态内存段的快照；对于开发人员来说，它非常有用，可以用于调试和确定崩溃的根本原因）。因此，让内核生成核心转储确实是有用的。我们如何安排这个呢？这其实非常简单：我们需要做以下几点：

将SIGSEGV信号的处理程序重置为（内核）默认值
在进程上重新引发信号

这段代码片段实现了这一点：

[...]
 * Now have the kernel generate the core dump by:
 * Reset the SIGSEGV to glibc default, and,
 * Re-raise it!
 */
 signal(SIGSEGV, SIG_DFL);
 raise(SIGSEGV);

由于这是一个简单的情况，我们只需使用更简单的signal(2) API 将信号的操作恢复为默认值。然后，我们再次使用库 API raise(3) 来在调用进程上引发给定的信号。（出于易读性的考虑，错误检查代码已被省略。）

寄存器转储

如前所述，dump_regs函数打印出 CPU 寄存器的值；以下是关于此的一些需要注意的事项：

这是非常特定于 CPU 的（下面显示的示例情况仅适用于 x86_64 CPU）。
为了实际访问 CPU 寄存器，我们利用信号处理程序函数的未记录的第三个参数（注意：当与SA_SIGINFO一起使用时），即所谓的用户上下文指针。它是可能解释的（正如我们在这里展示的），但是，当然，由于它在 glibc 系统调用（或其他）接口中没有正式可见，您不能依赖这个功能。谨慎使用（并进行大量测试）。

说到这里，让我们来看看代码：

/* arch - x86[_64] - specific! */
static inline void dump_regs(void *ucontext)
{
#define FMT "%016llx"
ucontext_t *uctx = (ucontext_t *)ucontext;

 fprintf(stderr,
 " RAX = 0x" FMT " RBX = 0x" FMT " RCX = 0x" FMT "\n"
 " RDX = 0x" FMT " RSI = 0x" FMT " RDI = 0x" FMT "\n"
 " RBP = 0x" FMT " R8 = 0x" FMT  " R9  = 0x" FMT "\n"

 " R10 = 0x" FMT " R11 = 0x" FMT " R12 = 0x" FMT "\n"
 " R13 = 0x" FMT " R14 = 0x" FMT " R15 = 0x" FMT "\n"
 " RSP = 0x" FMT "\n"

 "\n RIP = 0x" FMT " EFLAGS = 0x" FMT "\n"
 " TRAP# = %02lld ERROR = %02lld\n"
 /* CR[0,1,3,4] unavailable */
 " CR2 = 0x" FMT "\n"
 , uctx->uc_mcontext.gregs[REG_RAX]
 , uctx->uc_mcontext.gregs[REG_RBX]
 , uctx->uc_mcontext.gregs[REG_RCX]
 , uctx->uc_mcontext.gregs[REG_RDX]
 , uctx->uc_mcontext.gregs[REG_RSI]
 , uctx->uc_mcontext.gregs[REG_RDI]
 , uctx->uc_mcontext.gregs[REG_RBP]
 , uctx->uc_mcontext.gregs[REG_R8]
 , uctx->uc_mcontext.gregs[REG_R9]
 , uctx->uc_mcontext.gregs[REG_R10]
 , uctx->uc_mcontext.gregs[REG_R11]
 , uctx->uc_mcontext.gregs[REG_R12]
 , uctx->uc_mcontext.gregs[REG_R13]
 , uctx->uc_mcontext.gregs[REG_R14]
 , uctx->uc_mcontext.gregs[REG_R15]
 , uctx->uc_mcontext.gregs[REG_RSP]
 , uctx->uc_mcontext.gregs[REG_RIP]
 , uctx->uc_mcontext.gregs[REG_EFL]
 , uctx->uc_mcontext.gregs[REG_TRAPNO]
 , uctx->uc_mcontext.gregs[REG_ERR]
 , uctx->uc_mcontext.gregs[REG_CR2]
 );
}

现在，让我们运行两个测试用例：

*Test Case: Userspace, Invalid Read*
$ ./handle_segv u r
Attempting to read contents of arbitrary usermode va uptr = 0xdeadface:
handle_segv:
------------------- FATAL signal ---------------------------
 myfault: received signal 11. errno=0
 Cause/Origin: (si_code=1): SEGV_MAPERR: address not mapped to object
 Faulting instr or address = 0xdeadface
 --- Register Dump [x86_64] ---
RAX = 0x00000000deadface RBX = 0x0000000000000000 RCX = 0x0000000000000000
RDX = 0x0000000000000000 RSI = 0x0000000001e7b260 RDI = 0x0000000000000000
RBP = 0x00007ffc8d842110 R8  = 0x0000000000000008 R9  = 0x0000000000000000
R10 = 0x0000000000000000 R11 = 0x0000000000000246 R12 = 0x0000000000400850
R13 = 0x00007ffc8d8421f0 R14 = 0x0000000000000000 R15 = 0x0000000000000000
RSP = 0x00007ffc8d842040
RIP = 0x0000000000400e84 EFLAGS = 0x0000000000010202
TRAP# = 14 ERROR = 04
CR2 = 0x00000000deadface
------------------------------------------------------------
psiginfo helper: Segmentation fault (Address not mapped to object [0xdeadface])
------------------------------------------------------------
Segmentation fault (core dumped)
$

以下是一些需要注意的事项：

原始值是SEGV_MAPERR：是的，我们尝试读取的任意用户空间虚拟地址（0xdeadface）不存在（或映射），因此发生了段错误！
故障地址被显示为我们尝试读取的无效任意用户空间虚拟地址（0xdeadface）：
另外：一个重要的值——故障指令或地址——实际上是保存在 x86 的控制寄存器 2（CR2）中，如下所示。
TRAP 号显示为 14；在 x86[_64]上的 trap 14 是页面故障。事实上：当进程尝试读取无效虚拟地址（0xdeadface）时，错误访问导致了 x86[_64] MMU 引发了一个坏页故障异常，进而导致了操作系统故障处理程序的运行，并通过 SIGSEGV 杀死了进程。
CPU 寄存器也被转储。

好奇的读者也许会想知道每个寄存器究竟用来做什么。这超出了本书的范围；然而，读者可以通过查找 CPU OEM 的应用二进制接口（ABI）文档来找到有用的信息；其中包括函数调用、返回、参数传递等的寄存器使用。在 GitHub 存储库的进一步阅读部分查看 ABI 文档的更多内容。

psiginfo(3)也生效，打印出信号的原因和故障地址
消息Segmentation fault (core dumped)告诉我们我们的策略奏效了：我们将 SIGSEGV 的信号处理重置为默认值，然后重新引发了信号，导致操作系统（内核）生成了一个核心转储。生成的核心文件（在 Fedora 28 x86_64 上生成）如下所示：

$ ls -l corefile*
-rw-------. 1 kai kai 389120 Jun 24 14:23 'corefile:host=<hostname>:gPID=2413:gTID=2413:ruid=1000:sig=11:exe=<!<path>!<to>!<executable>!ch13!handle_segv.2413'
$

以下是一些要提到的要点：

对核心转储的详细分析和解释超出了本书的范围。使用 GDB 分析核心转储很容易；稍微搜索一下就会有结果。
核心文件的名称因发行版而异；现代的 Fedora 发行版设置名称非常描述性（如您所见）；实际上，核心文件名是通过proc文件系统中的内核可调参数来控制的。有关详细信息，请参阅core(5)的手册页。

我们运行内核空间的无效写入测试用例，为我们的handle_segv程序如下：

*Test Case: Kernel-space, Invalid* ***Write*** $ ./handle_segv k w
Attempting to write into arbitrary kernel va kptr = 0xffff0b9ffacedead:
handle_segv:
------------------- FATAL signal ---------------------------
 myfault: received signal 11. errno=0
 Cause/Origin: (si_code=128): kernel
 Faulting instr or address = 0x0
 --- Register Dump [x86_64] ---
RAX = 0xffff0b9ffacedead RBX = 0x0000000000000000 RCX = 0x0000000000000000
RDX = 0x0000000000000000 RSI = 0x00000000023be260 RDI = 0x0000000000000000
RBP = 0x00007ffcb5b5ff60 R8  = 0x0000000000000010 R9  = 0x0000000000000000
R10 = 0x0000000000000000 R11 = 0x0000000000000246 R12 = 0x0000000000400850
R13 = 0x00007ffcb5b60040 R14 = 0x0000000000000000 R15 = 0x0000000000000000
RSP = 0x00007ffcb5b5fe90

RIP = 0x0000000000400ffc EFLAGS = 0x0000000000010206
TRAP# = 13 ERROR = 00
CR2 = 0x0000000000000000
------------------------------------------------------------
psiginfo helper: Segmentation fault (Signal sent by the kernel [(nil)])
------------------------------------------------------------
Segmentation fault (core dumped)$

请注意，这次陷阱值为 13；在 x86[_64] MMU 上，这是通用保护故障（GPF）。再次，这次错误访问导致了 x86[_64] MMU 引发了 GPF 异常，进而导致了操作系统故障处理程序的运行，并通过 SIGSEGV 杀死了进程。陷阱是 GPF 是一个线索：我们违反了保护规则；回想一下第一章中所述的内容：运行在更高、更特权级别的进程（或线程）总是可以访问更低特权级别的内存，但反之则不行。在这里，运行在第三特权级的进程尝试访问第零特权级的内存；因此，MMU 引发了 GPF 异常，操作系统将其杀死（通过SIGSEGV）。

这一次，不幸的是，CR2 值和因此故障地址为 0x0（在崩溃发生在内核空间的情况下）。然而，我们仍然可以从其他寄存器中获得有价值的细节（指令和堆栈指针值等），接下来我们将看到。

在源代码中找到崩溃位置

RIP（指令指针**；**IA-32 上的 EIP，ARM 上的 PC）是有用的：使用它的值和一些实用程序，我们几乎可以确定进程崩溃时代码的位置。如何？有几种方法；其中一些如下：

使用工具链实用程序objdump（带有-d -S开关）
更简单的方法是使用gdb(1)（请参阅下文）
使用addr2line(1)实用程序

使用 GDB：

使用程序的调试版本（使用-g开关编译）加载gdb(1)，然后使用如下所示的list命令：

$ gdb -q ./handle_segv_dbg
Reading symbols from ./handle_segv_dbg...done.
(gdb) list *0x0000000000400ffc
<< 0x0000000000400ffc is the RIP value >>
0x400ffc is in main (handle_segv.c:212).
207 } else if ((tolower(argv[1][0]) == 'k') && tolower(argv[2][0] == 'w')) {
208 ADDR_TYPE *kptr = (ADDR_TYPE *) invalid_kaddr; // arbitrary kernel virtual addr
209 printf
210 ("Attempting to write into arbitrary kernel va kptr = 0x" ADDR_FMT ":\n",
211 (ADDR_TYPE) kptr);
212 *kptr = 0x2A; // writing
213 } else
214 usage(argv[0]);
215 exit(0);
216 }
(gdb)

list * <address>命令确切地指出了导致崩溃的代码，为了清晰起见，这里再次重现：

(gdb) l *0x0000000000400ffc
0x400ffc is in main (handle_segv.c:212).

第 212 行如下：

212: *kptr = 0x2A; // writing

这完全正确。

使用addr2line：

addr2line(1)实用程序提供了类似的功能；再次运行它针对使用-g编译的二进制可执行文件的-e开关版本（用于调试构建）：

$ addr2line -e ./handle_segv_dbg 0x0000000000400ffc
<...>/handle_segv.c:212
$

另外，想想：我们之前的ch12/altstack.c程序在其备用信号栈溢出时可能会遭受段错误；我们留给读者的练习是编写一个类似于此处所示的SIGSEGV处理程序来正确处理这种情况。

最后，我们已经表明处理段错误 SIGSEGV 对于找出崩溃原因非常有益；简单的事实仍然是，一旦此信号在进程上生成，该进程被认为处于未定义的，实际上是不稳定的状态。因此，不能保证我们在其信号处理程序中执行的任何工作实际上会按预期进行。因此，建议将信号处理代码保持最少。

信号 - 注意事项和陷阱

信号作为异步事件，可能以不立即显而易见的方式导致错误和错误（或者对程序员来说）。某些功能或行为直接或间接受到一个或多个信号到达的影响；您需要警惕可能的微妙竞争和类似条件。

我们已经涵盖的一个重要领域是：在信号处理程序内，您只能调用已记录为（或已设计为）异步信号安全的函数。其他领域也值得一些思考；继续阅读。

优雅地处理 errno

在使用系统调用和信号的程序中可能会出现与未初始化的全局整数errno的竞争。

errno 的作用是什么？

记住 errnoglobal；它是进程未初始化数据段中的未初始化全局整数（进程布局在第二章中已经涵盖，虚拟内存）。

errno 是用来做什么的？每当系统调用失败时，它会向用户空间返回-1。但是它为什么失败？啊，错误诊断，它失败的原因，以这种方式返回给用户空间：glibc 与内核一起，用正整数值 poke 全局 errno。这个值实际上是一个英文错误消息的二维数组的索引（它是以 NULL 结尾的）；它被称为_sys_errlist。因此，查找_sys_errlist[errno]会显示英文错误消息：系统调用失败的原因。

开发人员不再执行所有工作，而是设计了方便的例程，如perror(3)、strerror(3)和error(3)，通过查找_sys_errlist[errno]来发出错误消息。程序员经常在系统调用错误处理代码中使用这样的例程（事实上，我们确实这样做：查看我们的宏WARN和FATAL的代码 - 它们调用handle_err函数，该函数又调用perror(3)作为其处理的一部分）。

这是一个有用的查找项目 - 所有可能的errno值列表位于头文件/usr/include/asm-generic/errno-base.h中。

errno 竞争

考虑这种情况：

进程为几个信号设置了信号处理程序：

假设SIGUSR1的信号处理程序称为handle_sigusr。

现在进程正在运行其代码的一部分，一个名为foo的函数。

foo 发出一个系统调用，比如open(2)。
系统调用失败返回-1。
errno 设置为正整数13，反映了错误的权限被拒绝（errno 宏 EACCES）。
系统调用的错误处理代码调用perror(3)来发出英文错误消息。

所有这些似乎都很无辜，是的。但是，现在让我们考虑信号的情况；查看以下情景：

<…>
foo 发出一个系统调用，比如open(2)。
系统调用失败返回-1。
errno 设置为正整数13，反映了错误的权限被拒绝（errno 宏 EACCES）。
信号SIGUSR1此刻传递给进程。
控制转移到信号处理程序handle_sigusr。
这里的代码发出另一个系统调用，比如stat(2)。
stat(2)系统调用失败，返回-1。
现在errno被设置为正整数9，反映了错误的坏文件号（errno 宏 EBADF）。
信号处理程序返回。
系统调用的错误处理代码调用perror(3)来发出英文错误消息。

可以看到，由于事件序列，errno的值从 13 被覆盖为 9。结果是应用程序开发人员（以及项目中的其他人）现在被奇怪的错误报告所困扰（错误的坏文件号可能被报告两次！）。竞争——程序员的悲哀！

修复 errno 竞争

修复之前的竞争实际上非常简单。

每当你有一个信号处理程序，其中的代码可能导致errno值发生变化时，要在函数进入时保存errno，并在处理程序返回之前恢复它。

通过包含其头文件来简单地访问errno变量。以下是一个快速示例代码片段，显示了如何在信号处理程序中实现这一点：

<...>
include <errno.h>
<...>

static void handle_sigusr(int signum)
{
    int myerrno = errno;
    <... do the handling ...>
    <... syscalls, etc ...>
    errno = myerror;
}

正确睡眠

是的，即使睡眠也需要足够的知识才能正确执行！

通常，你的进程必须进入睡眠状态。我们都可能学会了使用sleep(3)API 来实现：

#include <unistd.h>
unsigned int sleep(unsigned int seconds);

举个简单的例子，假设进程必须以这种方式工作（伪代码如下）：

<...>
func_a();
sleep(10);
func_b();
<...>

很明显：进程必须睡眠10秒；所示的代码应该可以工作。有问题吗？

嗯，是的，信号：如果进程进入睡眠状态，但是在睡眠三秒钟后收到一个信号呢？默认行为（也就是说，除非信号被屏蔽）是处理信号，你会想象，然后回到睡眠状态，剩下的时间（七秒）。但是，不，事实并非如此：睡眠被中止了！敏锐的读者可能会争辩说可以通过使用SA_RESTART标志来修复这种行为（被信号中断的阻塞系统调用）；的确，这听起来是合理的，但现实是即使使用了该标志也没有帮助（睡眠必须手动重新启动）。

此外，重要的是要意识到sleep(3)API 文档规定其返回值是剩余的睡眠时间；因此，除非sleep(3)返回0，否则睡眠没有完成！实际上，开发人员期望在循环中调用sleep(3)，直到返回值为0。

让进程（或线程）"进入睡眠"到底意味着什么？

关键点在于：处于睡眠状态的进程（或线程）在该状态下无法在 CPU 上运行；它甚至不是 OS 调度程序的候选对象（从技术上讲，从状态转换

运行->睡眠是从运行队列出队并进入 OS 的等待队列，反之亦然）。有关更多信息，请参阅第十七章，Linux 上的 CPU 调度。

因此，我们得出结论，仅仅在代码中使用sleep(3)并不是一个好主意，因为：

一旦被信号传递中断，睡眠必须手动重新启动。
sleep(3)的粒度非常粗糙：一秒。（对于现代微处理器来说，一秒是非常非常长的时间！许多现实世界的应用程序依赖于至少毫秒到微秒级的粒度。）

那么，解决方案是什么？

nanosleep 系统调用

Linux 提供了一个系统调用nanosleep(2)，理论上可以提供纳秒级的粒度，也就是说，可以睡眠一纳秒。（实际上，粒度还取决于板上硬件定时器芯片的分辨率。）这是该 API 的原型：

#include <time.h>
int nanosleep(const struct timespec *req, struct timespec *rem);

系统调用有两个参数，都是指向数据类型为 struct timespec的结构的指针；该结构定义如下：

struct timespec {
    time_t tv_sec; /* seconds */
    long tv_nsec;  /* nanoseconds */
};

显然，这允许您以秒和纳秒为单位指定睡眠时间；第一个参数req是所需时间（s.ns），第二个参数rem是剩余的睡眠时间。看，操作系统在这里帮了我们：如果睡眠被信号（任何非致命的信号）中断，nanosleep系统调用失败，返回-1，并将errno设置为值EINTR（中断的系统调用）。不仅如此，操作系统会计算并返回（到这第二个指针，一个值-结果类型的参数），准确到纳秒的剩余睡眠时间。这样，我们检测到这种情况，将req设置为rem，并手动重新发出nanosleep(2)，使睡眠继续进行直到完全完成。

为了演示，我们接下来展示一个小应用程序（源代码：ch12/sleeping_beauty.c）；用户可以调用通常的sleep(3)睡眠方法，也可以使用高度优越的nanosleep(2)API，以便睡眠时间准确：

static void sig_handler(int signum)
{
     fprintf(stderr, "**Signal %d interruption!**\n", signum);
}

int main(int argc, char **argv)
{
     struct sigaction act;
     int nsec = 10, ret;
     struct timespec req, rem;

    if (argc == 1) {
         fprintf(stderr, "Usage: %s option=[0|1]\n"
            "0 : uses the sleep(3) function\n"
            "1 : uses the nanosleep(2) syscall\n", argv[0]);
         exit(EXIT_FAILURE);
     }
    /* setup signals: trap SIGINT and SIGQUIT */
     memset(&act, 0, sizeof(act));
     act.sa_handler = sig_handler;
     sigemptyset(&act.sa_mask);
     act.sa_flags = SA_RESTART;
     if (sigaction(SIGINT, &act, 0) || sigaction(SIGQUIT, &act, 0))
         FATAL("sigaction failure\n");

    if (atoi(argv[1]) == 0) {         /* sleep */
         printf("sleep for %d s now...\n", nsec);
         ret = sleep(nsec);
         printf("sleep returned %u\n", ret);
     } else if (atoi(argv[1]) == 1) { /* nanosleep */
         req.tv_sec = nsec;
         req.tv_nsec = 0;
         while ((nanosleep(&req, &rem) == -1) && (errno == EINTR)) {
             printf("nanosleep interrupted: rem time: %07lu.%07lu\n",
                 rem.tv_sec, rem.tv_nsec);
             req = rem;
         }
     }
 exit(EXIT_SUCCESS);
}

请注意前面代码中的以下内容：

将0作为参数传递使我们调用通常的sleep(3).。
我们故意在这里编写代码而不使用循环，因为这是大多数程序员调用sleep(3)的方式（因此我们可以看到其中的缺陷）。
将1作为参数传递使我们调用强大的nanosleep(2)API；我们将所需时间初始化为 10 秒（与前面的情况相同）。
但是，这一次，我们在循环中调用nanosleep(2)，检查信号中断情况errno == EINTR，如果是的话，
我们将req设置为rem并再次调用它！
（为了好玩，我们打印剩余时间s.ns）：

$ ./sleeping_beauty
Usage: ./sleeping_beauty option=[0|1]
0 : uses the sleep(3) function
1 : uses the nanosleep(2) syscall
$

让我们尝试两种情况：首先是通常的sleep(3)方法：

$ ./sleeping_beauty 0
sleep for 10 s now...
^C**Signal 2 interruption!**
sleep returned 7
$

睡眠几秒钟后，我们按下*^C*；信号到达，但睡眠被中止（如所示，睡眠还剩下额外的七秒，这里的代码简单地忽略了）！

现在是好的情况：通过nanosleep(2)睡眠：

$ ./sleeping_beauty 1
^C**Signal 2 interruption!**
nanosleep interrupted: rem time: 0000007.249192148
^\**Signal 3 interruption!**
nanosleep interrupted: rem time: 0000006.301391001
^C**Signal 2 interruption!**
nanosleep interrupted: rem time: 0000004.993030983
^\**Signal 3 interruption!**
nanosleep interrupted: rem time: 0000004.283608684
^C**Signal 2 interruption!**
nanosleep interrupted: rem time: 0000003.23244174
^\**Signal 3 interruption!**
nanosleep interrupted: rem time: 0000001.525725162
^C**Signal 2 interruption!**
nanosleep interrupted: rem time: 0000000.906662154
^\**Signal 3 interruption!**
nanosleep interrupted: rem time: 0000000.192637791
$

这一次，我们亲爱的睡美人（睡觉？）即使在连续中断多个信号的情况下也能完成。不过，你应该注意到这一点：确实会有一些开销。操作系统唯一保证的是睡眠至少持续所需的时间，可能会稍微长一些。

注意：尽管使用nanosleep(2)相对于通常的sleep(3)API 来说是一个高度优越的实现，但事实是，即使nanosleep也会受到（可能会变得显著）的时间超限的影响，当代码在循环中并且足够多的信号中断我们的循环很多次（就像在我们之前的例子中可能发生的那样）。在这种情况下，我们可能会睡得过多。为了解决这个问题，POSIX 标准和 Linux 提供了一个更好的clock_nanosleep(2)系统调用：使用它和实时时钟以及TIMER_ABSTIME标志值可以解决过度睡眠的问题。还要注意，尽管 Linux 的sleep(3)API 是通过nanosleep(2)内部实现的，但睡眠语义仍然如描述的那样；调用睡眠代码在循环中，检查返回值和失败情况是应用程序开发人员的责任。

实时信号

回想一下kill -l（l 代表列表）命令的输出；平台支持的信号都会显示出来——包括数字整数和符号名称。前 31 个信号是标准的 Unix 信号（在第十一章中看到，信号-第一部分，标准或 Unix 信号部分）；我们现在已经在使用它们了。

信号编号 34 到 64 都以SIGRT开头——SIGRTMIN到SIGRTMAX——它们被称为实时信号：

$ kill -l |grep "SIGRT"
31)SIGSYS      34) SIGRTMIN    35) SIGRTMIN+1  36) SIGRTMIN+2  37) SIGRTMIN+3
38)SIGRTMIN+4  39) SIGRTMIN+5  40) SIGRTMIN+6  41) SIGRTMIN+7  42) SIGRTMIN+8
43)SIGRTMIN+9  44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48)SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6  59) SIGRTMAX-5  60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1  64) SIGRTMAX 
$

（这里看到的第一个SIGSYS不是实时信号；它出现是因为它与其他 SIGRT 在同一行，所以grep(1)打印出来。）

与标准信号的不同之处

那么所谓的实时信号与常规标准信号有何不同；以下表格揭示了这一点：

特征	标准信号	实时信号
编号	1 - 31 ¹	34 - 64 ²
标准首次定义于	POSIX.1-1990（很旧）	POSIX 1003.1b：POSIX 的实时扩展（2001）
分配的含义	单个信号具有特定含义（并相应命名）；例外是`SIGUSR[1\|2]`	单个 RT 信号没有特定含义；它们的含义由应用程序定义
阻塞时和多个相同信号实例连续传递时的行为	在 n 个相同信号的实例中，n-1 个会丢失；只有 1 个实例保持挂起，并在解除阻塞时传递给目标进程	所有 RT 信号的实例都会被排队并在解除阻塞时由操作系统传递给目标进程（存在系统范围的上限³）
信号优先级	相同：所有标准信号都是对等的	FCFS，除非挂起；如果挂起，那么从最低编号的实时信号开始传递到最高编号的实时信号⁴
进程间通信（IPC）	粗糙的 IPC；可以使用`SIGUSR[1\|2]`进行通信，但无法传递数据	更好：通过`sigqueue(3)`，可以向对等进程发送单个数据项，整数或指针值（对等进程可以检索它）

标准信号和实时信号之间的差异

¹ 信号编号0？不存在，用于检查进程是否存在（稍后看到）。

² 一个常见问题：实时信号编号 32 和 33 发生了什么？答案：它们被 pthread 实现保留，因此应用程序开发人员无法使用。

³ 系统范围的上限是一个资源限制，因此可以通过prlimit(1)实用程序（或prlimit(2)系统调用）查询或设置：

$ prlimit |grep SIGPENDING
SIGPENDING max number of pending signals 63229     63229 signals
$

（回想一下第三章，资源限制，第一个数字是软限制，第二个是硬限制）。

⁴ RT 信号优先级：实时信号的多个实例将按照它们被传递的顺序进行处理（换句话说，先来先服务（FCFC）。但是，如果这些多个实时信号正在等待传递给进程，也就是说，它们当前被阻塞，那么它们将按照优先顺序进行处理，相当不直观地，SIGRTMIN是最高优先级信号，SIGRTMAX是最低优先级信号。

实时信号和优先级

POSIX 标准和 Linux 文档指出，当不同类型的多个实时信号正在等待传递给进程时（即进程正在阻塞它们）；然后，在某个时刻，当进程的信号掩码解除阻塞（从而允许信号传递）时，信号确实按照优先顺序传递：从最低信号编号到最高信号编号。

让我们测试一下：我们编写一个程序，捕获并在传递三个实时信号时阻塞：{SIGRTMAX-5，SIGRTMAX，SIGRTMIN+5}。（查看kill -l的输出；它们的整数值分别为{59，64，39}。）

重要的是，我们的程序在sigaction(2)时将使用sigfillset(3)便利方法，用全 1 填充结构 sigaction 的信号掩码成员，从而确保所有信号在信号处理程序代码运行时被阻塞（屏蔽）。

考虑以下内容：

进程（代码：ch12/rtsigs_waiter.c）捕获 RT 信号（使用 sigaction）

{SIGRTMAX-5，SIGRTMAX，SIGRTMIN+5}：整数值分别为{59，64，39}。

然后，我们有一个 shell 脚本（bombard_sigrt.sh）不断地发送这三个实时信号（或者按照请求的次数）以三个一组的方式，顺序如下：

{SIGRTMAX-5，SIGRTMAX，SIGRTMIN+5}：整数值分别为{59，64，39}。

第一个 RT 信号（＃59）导致进程进入信号处理程序例程；回想一下，我们已经在sigaction(2)时指定了所有信号在信号处理程序代码运行时都被阻塞（屏蔽）。
我们故意使用我们的DELAY_LOOP_SILENT宏来让信号处理程序运行一段时间。
因此，脚本传递的 RT 信号不能中断处理程序（它们被阻塞），因此操作系统将它们排队。
一旦信号处理程序完成并返回，队列中的下一个 RT 信号将被传递给进程。
按优先顺序，它们按从最低到最高的顺序交付，就像这样：

{SIGRTMIN+5, SIGRTMAX-5, SIGRTMAX}：整数值{39, 59, 64}。

下一次运行将在 Linux 上验证这种行为：

我们在这里不显示源代码；要查看完整的源代码，构建它并运行它，整个树可在 GitHub 上克隆：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux/blob/master/ch12/rtsigs_waiter.c和github.com/PacktPublishing/Hands-on-System-Programming-with-Linux/blob/master/ch12/bombard_sigrt.sh。

$ ./rtsigs_waiter
Trapping the three realtime signals
Process awaiting signals ...

在另一个终端窗口中，我们运行 bombard 脚本：

$ ./bombard_sigrt.sh 
Usage: bombard_sigrt.sh PID-of-process num-RT-signals-batches-to-send
 (-1 to continously bombard the process with signals).
$ $ ./bombard_sigrt.sh $(pgrep rtsigs_waiter) 3
Sending 3 instances each of RT signal batch
 {SIGRTMAX-5, SIGRTMAX, SIGRTMIN+5} to process 3642 ...
 i.e. signal #s {59, 64, 39}
SIGRTMAX-5 SIGRTMAX SIGRTMIN+5 SIGRTMAX-5 SIGRTMAX SIGRTMIN+5 SIGRTMAX-5 SIGRTMAX SIGRTMIN+5 
$

在rtsigs_waiter进程正在运行的原始终端窗口中，我们现在看到了这个：

sighdlr: signal 59, s=1 ; total=1; stack 0x7ffd2f9c6100 :*
sighdlr: signal 39, s=2 ; total=2; stack 0x7ffd2f9c6100 :*
sighdlr: signal 39, s=3 ; total=3; stack 0x7ffd2f9c6100 :*
sighdlr: signal 39, s=4 ; total=4; stack 0x7ffd2f9c6100 :*
sighdlr: signal 59, s=5 ; total=5; stack 0x7ffd2f9c6100 :*
sighdlr: signal 59, s=6 ; total=6; stack 0x7ffd2f9c6100 :*
sighdlr: signal 64, s=7 ; total=7; stack 0x7ffd2f9c6100 :*
sighdlr: signal 64, s=8 ; total=8; stack 0x7ffd2f9c6100 :*
sighdlr: signal 64, s=9 ; total=9; stack 0x7ffd2f9c6100 :*

注意以下内容：

脚本发送的第一个 RT 信号是SIGRTMAX-5（值 59）；因此，它进入信号处理程序并被处理。
当信号处理程序运行时，所有信号都被阻塞。
脚本继续输出剩余的 RT 信号（请参见其输出），而它们被屏蔽。
因此，它们由操作系统排队，并按优先顺序传递：从SIGRTMIN（最高）到SIGRTMAX（最低）的编号 RT 信号的优先顺序是从低到高。
由于它们被排队，没有信号会丢失。

这是一个截图，展示了相同的情况，对于更多数量的 RT 信号：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

将 10 传递给脚本（请参见右侧窗口）会使其传递 3x10：30 个 RT 信号，分为 10 批次的{SIGRTMIN+5, SIGRTMAX-5, SIGRTMAX}。请注意，在左侧窗口中，除了第一个实例之外，它们（被排队并）按优先顺序处理，从低到高——首先是所有的 39（SIGRTMIN+5），然后是所有的 59（SIGRTMAX-5），最后是最低优先级的 64（SIGRTMAX）RT 信号。

该脚本通过发出kill(1)命令向进程发送信号；这将在本章后面详细解释。

总之，实时信号的处理方式如下：

如果解除阻塞，它们将按 FCFS 顺序依次处理。
如果被阻塞，它们将按优先顺序排队并传递——最低的 RT 信号具有最高优先级，最高的 RT 信号具有最低优先级。

和往常一样，强烈建议您，读者，查看代码并自己尝试这些实验。

发送信号

我们通常看到内核向进程发送信号的情况；没有理由一个进程不能向另一个进程发送信号（或多个）。在本节中，我们将深入探讨从一个进程向另一个进程发送信号以及与此相关的想法的细节。

你可能会想，即使你可以向另一个进程发送信号，那有什么用呢？嗯，想想看：信号发送可以用作进程间通信（IPC）机制。此外，这是一种检查进程存在的方法！还有其他有用的情况，比如向自己发送信号。让我们进一步探讨这些情况。

只是杀死它们

我们如何向另一个进程发送信号：简短的答案是通过kill(2)系统调用。kill API 可以向给定 PID 的进程传递任何信号；来自kill(2)手册页的函数签名：

#include <sys/types.h>
#include <signal.h>

int kill(pid_t pid, int sig);

注意它非常通用——你几乎可以向任何进程发送任何信号（也许更好的名字可能是sendsig，但当然，这并不像kill那样令人兴奋）。

用户命令kill(1)当然是kill(2)系统调用的包装器。

显然，根据前面的 API，您可以推断信号sig被发送到具有 PID 值pid的进程。不过，请稍等，还有一些特殊情况需要考虑；请参阅以下表格：

kill PID 值	含义
> 0	信号发送给 PID 等于该值的进程（通常情况）。
0	信号发送给调用者进程组内的所有进程。
-1	信号发送给调用者有权限发送的所有进程，但不包括整体祖先进程 PID 1（传统上是 init，现在是 systemd）。²
< -1	信号发送给进程组 one 内具有 ID`pid`的所有进程。

¹ 进程组：每个进程都将成为一个进程组的成员（每个 pgrp 都有自己独特的 ID，等于第一个成员的 PID，称为进程组领导者。使用ps j查找进程组详细信息；还有系统调用get|set]pgid(2), [get|set]pgrp(2)可用。

如果通过管道运行一系列进程（例如，ps aux |tail |sort -k6n），并且在运行时在键盘上输入*^C*，那么我们知道信号 SIGINT 是通过内核的 tty 层生成的；但是发送给哪个进程呢？当前作为前置管道一部分运行的所有进程形成了前台进程组。关于信号传递的重要性：通过键盘生成的任何信号（如*^C*、**、^Z）都会传递给属于前台进程组的所有进程。（因此所有三个进程都会收到该信号。请查看更多阅读部分，了解有关进程组的更多信息的 GitHub 存储库链接。）

在 Linux 上，kill(-1, sig)不会将sig发送给调用进程本身。

用加薪来杀死自己

尽管听起来戏剧性，但这里我们指出一个简单的包装 API：*raise(3)*库调用。以下是它的签名：

include <signal.h>
int raise(int sig);

这真的非常简单：给定一个信号编号，raise API 会向调用进程（或线程）发送给定的信号。如果所讨论的信号被捕获，raise将只在信号处理程序完成后返回一次。

回想一下，在本章的早些时候，我们在handle_segv.c程序中使用了这个 API：我们用它来确保对于信号 SIGSEGV，在我们自己的处理完成后，我们重新向自己发送相同的信号，从而确保核心转储发生。

（嗯，哲学上来说，获得加薪对您的幸福指数只能起到有限的作用。）

00 特工-有权杀人

在伊恩·弗莱明的书中，詹姆斯·邦德是一名双零特工（007）：一名有权杀人的特工！

嗯，就像邦德一样，我们也可以杀死；嗯，当然是一个进程，也就是发送一个信号。这并不像邦德那样戏剧性和令人兴奋，但是，嘿，我们可以！嗯，当且仅当我们有权限这样做时。

所需的权限：发送进程必须满足以下条件之一：

拥有 root 权限-根据现代的能力模型（回想第八章，进程能力），要求是进程具有CAP_KILL能力位设置；来自capabilities(7)的 man 页面：CAP_KILL：绕过发送信号的权限检查（参见kill(2)）。
拥有目标进程，这意味着发送者的 EUID（有效 UID）或 RUID（真实 UID）和目标的 EUID 或 RUID 应该匹配。

kill(2)的 man 页面在 Linux 上详细说明了一些关于发送信号权限的特殊情况；如果感兴趣，可以看一下。

因此，尽管听起来很诱人，但只是执行一个循环（伪代码如下）并不一定适用于所有活动进程，主要是因为缺乏权限：

for i from 1 to PID_MAX
    kill(i, SIGKILL)

即使你以 root 身份运行类似之前显示的代码，系统也会禁止突然终止关键进程，比如 systemd（或 init）。（为什么不试试——反正这是一个建议的练习。当然，尝试这样的东西是在自找麻烦；我们建议你在测试虚拟机中尝试。）

你在吗？

检查进程的存在非常重要，现在它还活着吗？对于应用程序来说可能至关重要。例如，应用程序函数接收进程的 PID 作为参数。在实际使用提供的 PID 之前（也许发送一个信号），验证一下进程是否有效是个好主意（如果它已经死了或 PID 无效怎么办？）。

kill(2)系统调用在这方面帮助我们：kill的第二个参数是要发送的信号；使用值0（回想一下没有编号为 0 的信号）验证第一个参数：PID。具体是如何验证的？如果kill(2)返回失败，要么 PID 无效，要么我们没有权限发送信号给进程（或进程组）。

以下伪代码演示了这一点：

static int app_func_A(int work, pid_t target)
{
    [...]
    if (kill(target, 0) < 0)
        <handle it>
        return -1;
    *[...it's fine; do the work on 'target'...]*
}

信号作为 IPC

我们了解到，现代操作系统（如 Linux）使用的虚拟内存架构的一个基本副作用是，进程只能访问其自己的虚拟地址空间（VAS）内存；而且只能访问有效映射的内存。

实际上，这意味着一个进程不能读取或写入任何其他进程的 VAS。是的；但是，那么你如何与其他进程通信呢？这种情况在许多多进程应用程序中非常关键。

简短的回答：IPC 机制。Linux 操作系统有几种；在这里，我们使用其中一种：信号。

粗糙的 IPC

想想看，这很简单：进程 A 和 B 是多进程应用程序的一部分。现在进程 A 想要通知进程 B 它已经完成了一些工作；在收到这个信息后，我们期望进程 B 做出相同的确认。

我们可以通过信号设计一个简单的 IPC 方案，如下所示：

进程 A 正在执行它的工作。
进程 B 正在执行它的工作（它们当然是并行运行的）。
进程 A 达到一个里程碑；它通过发送SIGUSR1（通过kill(2)）通知进程 B。
捕获了信号后，进程 B 进入其信号处理程序并根据需要验证事物。
它通过发送进程 A 来确认消息，比如说，SIGUSR2（通过kill(2)）。
捕获了信号后，进程 A 进入其信号处理程序，理解来自 B 的确认已经收到，生活继续。

（读者可以尝试这个作为一个小练习。）

然而，我们应该意识到一个重要的细节：IPC 意味着能够向另一个进程发送数据。然而，在上面，我们无法传输或接收任何数据；只是我们可以通过信号进行通信的事实（嗯，你可以争论信号编号本身就是数据；在有限的意义上是真的）。因此，我们将这视为一种粗糙的 IPC 机制。

更好的 IPC - 发送数据项

这让我们来到下一个有趣的事实：通过信号是可以发送数据量子——一小段数据——的。要看如何做到这一点，让我们重新审视我们在本章前面学习的强大的siginfo_t结构。为了让信号处理程序接收到指针，回想一下我们在调用sigaction(2)时使用SA_SIGINFO标志。

回想一下，在struct siginfo_t中，前三个成员是简单的整数，第四个成员是结构的联合体，有七个——其中只有一个会在运行时实例化；实例化的取决于处理的信号！

为了帮助我们回忆，这是siginfo_t结构的初始部分：

typedef struct {
    int si_signo; /* Signal number. */
    int si_code;  
    int si_errno; /* If non-zero, an errno value associated with
           this signal, as defined in <errno.h>. */
    union
    {
         int _pad[__SI_PAD_SIZE];
        /* kill(). */
         struct
         {
             __pid_t si_pid; /* Sending process ID. */
             __uid_t si_uid; /* Real user ID of sending process. */
         } _kill;

    [...]

在结构的联合体中，我们现在感兴趣的结构是处理实时信号的结构——这个：

[...]
 /* POSIX.1b signals. */
         struct
         {
             __pid_t si_pid; /* Sending process ID. */
             __uid_t si_uid; /* Real user ID of sending process. */
             __sigval_t si_sigval; /* Signal value. */
         } _rt;
[...]

因此，很简单：如果我们捕获了一些实时信号并使用SA_SIGINFO，我们将能够检索到这个结构的指针；前两个成员显示了发送进程的 PID 和 RUID。这本身就是有价值的信息！

第三个成员，sigval_t，是关键（在 Ubuntu 上是/usr/include/asm-generic/siginfo.h，在 Fedora 上是/usr/include/bits/types/__sigval_t.h）：

union __sigval
{
    int __sival_int;
    void *__sival_ptr;
};
typedef union __sigval __sigval_t;

注意，sigval_t本身是两个成员的联合：一个整数和一个指针！我们知道联合在运行时只能有一个成员实例化；所以这里的问题是：发送进程用数据填充前面的成员之一，然后向接收进程发送实时信号。接收方可以通过适当地取消引用前面的联合来提取发送的数据量。这样，我们就能够在进程之间发送数据；数据实际上是搭载在实时信号上的！非常酷。

但是想一想：我们只能使用其中一个成员来携带我们的数据，要么是整数int sival_int，要么是void * sival_ptr指针。应该使用哪一个？回想一下我们在第十章中学到的内容是很有启发性的，即进程创建：进程中的每个地址都是虚拟地址；也就是说，我的虚拟地址 X 可能指向的并不是你的虚拟地址 X 所指向的相同的物理内存。换句话说，尝试通过指针来传递数据，实际上只是一个虚拟地址，可能不会像预期的那样有效。（如果你对此不确定，我们建议重新阅读第十章中的malloc和The fork部分，进程创建。）

总之，使用整数来保存和传递数据给我们的对等进程通常是一个更好的主意。事实上，C 程序员知道如何从内存中提取每一个比特；你总是可以将整数视为位掩码，并传递更多的信息！

此外，C 库提供了一个辅助例程，可以很容易地发送一个带有嵌入数据的信号，sigqueue(3) API。它的签名：

#include <signal.h>
int sigqueue(pid_t pid, int sig, const union sigval value);

前两个参数很明显：要发送信号sig的进程；第三个参数value是讨论过的联合。

让我们试一试；我们编写一个小的生产者-消费者类型的应用程序。我们在后台运行消费者进程；它轮询，等待生产者发送一些数据。（正如你可能猜到的那样，轮询并不理想；在多线程主题中，我们将介绍更好的方法；但现在，我们只是简单地轮询。）当接收者检测到已经发送数据给它时，它会显示所有相关的细节。

首先，一个示例运行：首先，我们在后台运行消费者（接收者）进程（ch12/sigq_ipc/sigq_recv.c）：

$ ./sigq_recv & [1] 13818
./sigq_recv: Hey, consumer here [13818]! Awaiting data from producer
(will poll every 3s ...)
$

接下来，我们运行生产者（ch12/sigq_ipc/sigq_sender.c），向消费者发送一个数据项：

$ ./sigq_sender 
Usage: ./sigq_sender pid-to-send-to value-to-send[int]
$ ./sigq_sender $(pgrep sigq_recv) 42
Producer [13823]: sent signal 34 to PID 13818 with data item 42
$nanosleep interrupted: rem time: 0000002.705461411

消费者处理信号，理解数据已经到达，并在下一个轮询周期打印出详细信息：

Consumer [13818] received data @ Tue Jun 5 10:20:33 2018
:
signal # : 34
Producer: PID : 1000
          UID : 1000           data item : 42

为了可读性，下面只显示了源代码的关键部分；要查看完整的源代码，构建并运行它，整个树都可以从 GitHub 上克隆：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux。

这里是接收者：ch12/sigq_ipc/sigq_recv.c：main()函数：

#define SIG_COMM   SIGRTMIN
#define SLP_SEC    3

[...]
static volatile sig_atomic_t data_recvd=0;
[...]
int main(int argc, char **argv)
{
 struct sigaction act;

 act.sa_sigaction = read_msg;
 sigfillset(&act.sa_mask); /* disallow all while handling */
 act.sa_flags = SA_SIGINFO | SA_RESTART;
 if (sigaction(SIG_COMM, &act, 0) == -1)
     FATAL("sigaction failure");

 printf("%s: Hey, consumer here [%d]! Awaiting data from producer\n"
         "(will poll every %ds ...)\n",
        argv[0], getpid(), SLP_SEC);

/* Poll ... not the best way, but just for this demo... */
 while(1) {
    r_sleep(SLP_SEC);
    if (data_recvd) {
        display_recv_data();
 data_recvd = 0;
    }
 }
 exit(EXIT_SUCCESS);
}

我们在实时信号到达时进行轮询，每次循环迭代都在循环中睡眠三秒钟；轮询实际上并不是编码的最佳方式；但现在，我们只是保持简单并这样做（在第十四章中，使用 Pthreads 进行多线程编程第 I 部分-基础知识和第十五章中，使用 Pthreads 进行多线程编程第 II 部分-同步，我们将介绍其他有效的同步数据值的方法）。

正如在正确休眠部分中所解释的，我们更喜欢使用我们自己的包装器而不是nanosleep(2)，我们的r_sleep()函数，保持休眠安全。

与此同时，发送者代码的一部分：ch12/sigq_ipc/sigq_sender.c：send_peer()：

static int send_peer(pid_t target, int sig, int val)
{
 union sigval sv;

 if (kill(target, 0) < 0)
     return -1;

 sv.sival_int = val;
 if (sigqueue(target, sig, sv) == -1)
     return -2;
 return 0;
}

这个函数执行检查目标进程是否确实存活的工作，如果是的话，通过有用的sigqueue(3)库 API 向其发送实时信号。一个关键点：我们将要发送的数据包装或嵌入到sigval联合体中，作为一个整数值。

回到接收者：当它确实接收到实时信号时，它指定的信号处理程序代码read_msg()将运行：

[...]
typedef struct {
  time_t timestamp;
  int signum;
  pid_t sender_pid;
  uid_t sender_uid;
  int data;
} rcv_data_t;
static rcv_data_t recv_data;

[...]

/* 
 * read_msg
 * Signal handler for SIG_COMM.
 * The signal's receipt implies a producer has sent us data;
 * read and place the details in the rcv_data_t structure.
 * For reentrant-safety, all signals are masked while this handler runs.
 */
static void read_msg(int signum, siginfo_t *si, void *ctx)
{
 time_t tm;

 if (time(&tm) < 0)
     WARN("time(2) failed\n");

 recv_data.timestamp = tm;
 recv_data.signum = signum;
 recv_data.sender_pid = si->si_pid;
 recv_data.sender_uid = si->si_uid;
 recv_data.data = si->si_value.sival_int;

 data_recvd = 1;
}

我们更新一个结构来保存数据（和元数据），使我们能够在需要时方便地打印它。

侧边栏 - LTTng

作为一个非常有趣的旁注，如果能够实际追踪发送者和接收者进程在执行时的流程，那不是很棒吗？嗯，Linux 提供了几种工具来做到这一点。其中比较复杂的是一个名为Linux Tracing Toolkit next generation（LTTng）的软件。

LTTng 真的很强大；一旦设置好，它就有能力跟踪内核和用户空间（尽管跟踪用户空间需要应用程序开发人员明确地对其代码进行仪器化）。嗯，您的作者使用 LTTng 来对系统（内核空间）进行跟踪，而前面的进程运行；LTTng 完成了它的工作，捕获了跟踪数据（以 CTF 格式）。

然后，使用了出色的Trace Compass GUI 应用程序以有意义的方式显示和解释跟踪会话；以下屏幕截图显示了一个示例；您可以看到发送者通过sigqueue(3)库 API 向接收进程发送信号的时间点，正如您所看到的，这被转换为rt_sigqueueinfo(2)系统调用（其在内核中的入口点显示为syscall_entry_rt_sigqueueinfo事件）。

接下来，接收进程（这里是sigq_trc_recv）接收（然后处理）了信号：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

（作为一个有趣的事情：计算发送实时信号和接收信号之间的时间差，分别用紫色和红色标记。大约是 300 毫秒（微秒）。）

LTTng 的细节不在本书的范围之内；请参阅 GitHub 存储库上的进一步阅读部分。

为了完整起见，我们还注意到以下发送信号的 API：

pthread_kill(3): 一个 API，用于向同一进程中的特定线程发送信号
tgkill(2): 一个 API，用于向给定线程组中的特定线程发送信号
tkill(2): tgkill 的一个已弃用的前身

现在让我们暂时忽略这些；这些 API 在后面的第十四章中，即本书中的使用 Pthreads 进行多线程编程的第一部分 - 基础知识中，将在多线程的上下文中变得更加相关。

替代的信号处理技术

到目前为止，在前一章以及这一章关于信号的内容中，我们已经看到并学会了使用几种技术来异步捕获和处理信号。基本思想是：进程正在忙于执行其工作，运行其业务逻辑；突然收到一个信号；尽管如此，进程必须处理它。我们详细地看到了如何利用强大的sigaction(2)系统调用来做到这一点。

现在，我们以一种不同的方式来看待信号处理：同步处理信号，也就是说，如何让进程（或线程）等待（阻塞）信号并在其到达时处理它们。

即将到来的关于多线程的章节将提供一些相同用例。

同步等待信号

乍一看，以及传统的信号传递方式，似乎信号是异步的，为什么会有人尝试同步阻塞信号的传递呢？事实上：在大型项目中执行健壮的信号处理是一件难以正确和一致地做到的事情。许多复杂性源于信号异步安全问题；我们不允许在信号处理程序中使用任何 API；只有相对较小的 API 子集被认为是异步信号安全的，并且可以使用。这在大型程序中带来了重大障碍，当然，有时程序员会无意中引起缺陷（错误）（而且，这些缺陷在测试期间很难捕捉到）。

当消除具有信号安全要求设计的整个异步信号处理程序时，这些信号处理困难几乎消失了。如何做到？通过对信号进行同步阻塞，当信号到达时，立即处理它们。

因此，本节的目标是教会初学的系统程序员这些重要的概念（以及它们的 API）；学会使用这些 API 可以显著减少异常和错误。

在 Linux 操作系统上存在许多有用的机制来执行同步信号处理；让我们从简单但有用的pause(2)系统调用开始。

请暂停

pause是一个非常好的阻塞调用的例子；当进程调用此 API 时，它会阻塞，也就是说，它会进入睡眠状态等待事件的发生；事件：任何信号到达。一旦信号到达，pause就会解除阻塞，执行继续。当然，传递致命信号将导致毫无防备的进程死亡：

include <unistd.h>
 int pause(void);

在整个过程中，我们一直强调检查系统调用的失败情况-1是非常重要的：这是一种始终要遵循的最佳实践。pause(2)提出了一个有趣的异常情况：它似乎是唯一一个始终返回-1并且将errno设置为值EINTR的系统调用（中断当然是信号）。

因此，我们经常将pause编码如下：

(void)pause();

将类型转换为void是为了通知编译器和静态分析器等工具，我们并不真的关心来自pause的返回值。

永远等待或直到收到信号

通常，人们希望永远等待，或者直到收到信号。一种方法是非常简单但非常糟糕的，非常昂贵的在 CPU 上旋转的代码，比如：

while (1);

天啊！那太丑陋了：请不要编写这样的代码！

略微好一些，但仍然相当偏离的是：

while (1)
    sleep(1);

pause可以有效且高效地设置一个有用的永远等待或直到我收到任何信号的语义，如下所示：

while (1)
 (void)pause();

这种语义对于这种永远等待或直到我收到任何信号的情况非常有用，因为它很廉价（几乎没有 CPU 使用率，因为pause(2)会立即使调用者进入睡眠状态），并且只有在信号到达时才解除阻塞。然后，整个情景重复（当然是由于无限循环）。

通过`sigwait*`API 同步阻塞信号

接下来，我们简要介绍一组相关函数，即sigwait*API；它们如下：

sigwait(3)
sigwaitinfo(2)
sigtimedwait(2)

所有这些 API 都允许进程（或线程）在收到一个或多个信号时阻塞（等待）。

sigwait 库 API

让我们从sigwait(3)开始：

include <signal.h>
 int sigwait(const sigset_t *set, int *sig);

sigwait(3)库 API 允许进程（或线程）阻塞，等待，直到信号集set中的任何信号待传递给它。一旦信号到达，sigwait就会解除阻塞；到达的特定信号及其整数值将放置在值-结果的第二个参数sig中。在底层，sigwait从进程（或线程）的挂起掩码中删除刚刚传递的信号。

因此，sigwait(3)相对于pause(2)具有以下优势：

您可以等待将特定信号传递给进程
当其中一个信号被传递时，它的值是已知的

sigwait(3)的返回值在成功时为0，在错误时为正值（请注意，它是一个库 API，errno不受影响）。（在内部，sigwait(3)是通过sigtimedwait(2) API 实现的。）

然而，事情并不总是像乍一看那么简单。事实是有一些重要的要点需要考虑：

如果等待的信号没有被调用进程首先阻塞，就会设置一个风险情况，称为竞争。（从技术上讲，这是因为在信号传递到进程和sigwait调用初始化之间存在一个机会窗口）。一旦运行，sigwait将原子地解除信号阻塞，允许它们被传递给调用进程。
如果一个信号（在我们定义的信号集中）也通过sigaction(2)或signal(2) API 以及sigwait(3) API 被捕获，那么在这种情况下，POSIX 标准规定由实现决定如何处理传递的信号；Linux 似乎更倾向于通过sigwait(3)处理信号。（这是有道理的：如果一个进程发出sigwait API，该进程会阻塞信号。如果信号变为挂起状态（意味着它刚刚被传递到进程），则sigwait API 会吸收或消耗信号：它现在不再挂起传递到进程，因此不能通过sigaction(2)或signal(3) API 设置的信号处理程序捕获。）

为了测试这一点，我们编写了一个小应用程序ch12/sigwt/sigwt.c以及一个 shell 脚本ch12/sigwt/bombard.sh来对其进行所有信号的轰炸。（读者将像往常一样在书的 GitHub 存储库中找到代码；这次，我们留给读者来研究源代码并进行实验。）以下是一些示例运行：

在一个终端窗口中，我们按以下方式运行我们的sigwt程序：

$ ./sigwt 
Usage: ./sigwt 0|1
 0 => block All signals and sigwait for them
 1 => block all signals except the SIGFPE and SIGSEGV and sigwait
 (further, we setup an async handler for the SIGFPE, not the SIGSEGV)
$ ./sigwt 0
./sigwt: All signals blocked (and only SIGFPE caught w/ sigaction)
[SigBlk: 1 2 3 4 5 6 7 8 10 11 12 13 14 15 16 17 18 20 21 22 23 24 25 26 27 28 29 30 31 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 ]
./sigwt: waiting upon signals now ...

请注意，我们首先通过sigprocmask(2)阻塞了所有信号；我们调用我们的通用common.c:show_blocked_signals()函数来显示进程信号掩码中当前阻塞的所有信号；如预期的那样，所有信号都被阻塞，除了明显的 9、19、32 和 33 号信号（为什么？）。请记住，一旦运行，sigwait(3)将原子地解除信号阻塞，允许它们被传递给调用者。

在另一个终端窗口中，运行 shell 脚本；脚本的工作很简单：它发送（通过kill(1)）从 1 到 64 的每个信号，除了SIGKILL（9）、SIGSTOP（19）、32 和 33——这两个 RT 信号保留供 pthread 框架使用：

$ ./bombard.sh $(pgrep sigwt) 1
Sending 1 instances each of ALL signals to process 2705
1 2 3 4 5 6 7 8 10 11 12 13 14 15 16 17 18 20 21 22 23 24 25 26 27 28 29 30 31 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 
$

在原始窗口中，我们观察到输出：

Received signal# 1
Received signal# 2
Received signal# 3
Received signal# 4
Received signal# 5
Received signal# 6
Received signal# 7
Received signal# 8
Received signal# 10
Received signal# 11
[...]
Received signal# 17
Received signal# 18
Received signal# 20
Received signal# 21
[...]
Received signal# 31
Received signal# 34
Received signal# 35
Received signal# 36
Received signal# 37
[...]
Received signal# 64

所有传递的信号都通过sigwait进行了处理！包括SIGFPE（＃8）和SIGSEGV（＃11）。这是因为它们是由另一个进程（shell 脚本）同步发送的，而不是由内核发送的。

快速的pkill(1)会终止sigwt进程（如果需要提醒：SIGKILL 和 SIGSTOP 不能被屏蔽）：

pkill -SIGKILL sigwt

现在进行下一个测试案例，使用选项1运行它：

$ ./sigwt 
Usage: ./sigwt 0|1
 0 => block All signals and sigwait for them
 1 => block all signals except the SIGFPE and SIGSEGV and sigwait
 (further, we setup an async handler for the SIGFPE, not the SIGSEGV) $ ./sigwt 1
./sigwt: removing SIGFPE and SIGSEGV from the signal mask...
./sigwt: all signals except SIGFPE and SIGSEGV blocked
[SigBlk: 1 2 3 4 5 6 7 10 12 13 14 15 16 17 18 20 21 22 23 24 25 26 27 28 29 30 31 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 ]
./sigwt: waiting upon signals now ...

注意信号编号 8（SIGFPE）和 11（SIGSEGV）现在被阻塞，而其他信号都不被阻塞（除了通常的 9、19、32、33）。请记住，一旦运行，sigwait(3)将原子地解除信号阻塞，允许它们被传递给调用者。

在另一个终端窗口中，运行 shell 脚本：

$ ./bombard.sh $(pgrep sigwt) 1
Sending 1 instances each of ALL signals to process 13759
1 2 3 4 5 6 7 8 10 11 ./bombard.sh: line 16: kill: (13759) - No such process
bombard.sh: "kill -12 13759" failed, loop count=1
$

在原始窗口中，我们观察到输出：

Received signal# 1
Received signal# 2
Received signal# 3
Received signal# 4
Received signal# 5
Received signal# 6
Received signal# 7
*** siggy: handled SIGFPE (8) ***
Received signal# 10
Segmentation fault (core dumped)
$

当我们捕获SIGFPE（通过sigaction(2)）时，它被处理；然而，未捕获的SIGSEGV当然会导致进程异常死亡。一点也不愉快。

对代码进行一些小的调整揭示了一个有趣的方面；原始代码片段如下：

[...]
if (atoi(argv[1]) == 1) {
    /* IMP: unblocking signals here removes them from the influence of 
     * the sigwait* APIs; this is *required* for correctly handling
     * fatal signals from the kernel.
     */
    printf("%s: removing SIGFPE and SIGSEGV from the signal mask...\n",         argv[0]);
    sigdelset(&set, SIGFPE);
#if 1
 sigdelset(&set, SIGSEGV);
#endif
[...]

如果我们通过将前面的#if 1更改为#if 0来有效地阻止SIGSEGV会发生什么？让我们这样做，重新构建并重试：

[...]
Received signal# 1
Received signal# 2
Received signal# 3
Received signal# 4
Received signal# 5
Received signal# 6
Received signal# 7
*** siggy: handled SIGFPE (8) ***
Received signal# 10
Received signal# 11
Received signal# 12
[...]

这次SIGSEGV通过sigwait进行了处理！确实；但只是因为它是由进程人为生成的，而不是由操作系统发送的。

因此，像往常一样，还有更多内容：信号处理的具体方式由以下因素决定：

在调用sigmask（或其变体）之前，进程是否阻塞信号
关于致命信号（如SIGILL，SIGFPE，SIGSEGV，SIGBUS等），信号是如何生成的很重要：人为地，通过进程（kill(2)）或实际由内核生成（由于某种错误）
我们发现以下内容：
如果信号在调用sigwait之前被进程阻塞，那么如果信号是通过kill(2)（或变体）人为地传递的，sigwait将在信号传递时解除阻塞，应用程序开发人员可以处理该信号。
然而，如果致命信号是由于内核的错误而通过操作系统传递的，那么无论进程是否阻塞它，都会发生默认操作，突然（和可耻地）终止进程！这可能不是人们想要的；因此，我们得出结论，最好通过通常的异步sigaction(2)风格而不是通过sigwait（或其变体）来捕获前述的致命信号。

`sigwaitinfo`和`sigtimedwait`系统调用

sigwaitinfo(2)系统调用类似于 sigwait：提供一组要注意的信号，该函数将调用者置于休眠状态，直到其中任何一个信号（在集合中）挂起。这是它们的原型：

#include <signal.h>
int sigwaitinfo(const sigset_t *set, siginfo_t *info);
int sigtimedwait(const sigset_t *set, siginfo_t *info,
    const struct timespec *timeout);

就返回而言，sigwait API 能够为我们提供传递给调用进程的信号编号。但是，请记住，sigaction(2) API 的一个更强大的特性是——能够在siginfo_t数据结构中返回有价值的诊断和其他信息。这正是sigwaitinfo(2)系统调用提供的功能！（我们在详细介绍SA_SIGINFO的信息部分中已经介绍了siginfo_t结构以及您可以从中解释的内容。）

sigtimedwait(2)呢？嗯，很明显；它与sigwaitinfo(2) API 相同，只是多了一个参数——超时值。因此，该函数将阻塞调用者，直到集合中的一个信号挂起，或超时到期（以先发生者为准）。超时是通过一个简单的timespec结构指定的，它允许提供秒和纳秒的时间：

struct timespec {
    long tv_sec; /* seconds */
    long tv_nsec; /* nanoseconds */
}

如果结构被 memset 为零，sigtimedwait(2)将立即返回，要么返回有关挂起信号的信息，要么返回错误值。sigwaitinfo(2)和sigtimedwait(2) API 在成功时返回实际的信号编号，失败时返回-1，并适当设置errno。

一个重要的要点（之前已经提到过，但很关键）：sigwait、sigwaitinfo或sigtimedwait API 都不能等待内核同步生成的信号；通常是指示某种失败的信号，如SIGFPE和SIGSEGV。这些只能以正常的异步方式捕获——通过signal(2)或sigaction(2)。对于这种情况，正如我们反复展示的那样，sigaction(2)系统调用将是更好的选择。

`signalfd(2)` API

读者会回忆起，在第一章中，Linux 系统架构，在标题为Unix 哲学的要点的部分中，我们强调了 Unix 哲学的一个基石是：

在 Unix 上，一切都是一个进程；如果不是进程，就是一个文件。

经验丰富的 Unix 和 Linux 开发人员非常习惯将东西抽象为文件的概念；这包括设备、管道和套接字。为什么不包括信号呢？

这正是signalfd(2)系统调用的理念；使用signalfd，您可以创建一个文件描述符并将其与信号集关联起来。现在，应用程序员可以自由地使用各种熟悉的基于文件的 API 来监视信号 - 其中包括read(2)、select(2)和poll(2)（及其变体），以及close(2)。

与我们讨论过的sigwait*API 系列类似，signalfd是另一种让进程（或线程）同步阻塞信号的方法。

你如何使用signalfd(2) API？它的签名如下：

#include <sys/signalfd.h>
int signalfd(int fd, const sigset_t *mask, int flags);

第一个参数fd，要么是现有的信号描述符，要么是值-1。当传递-1 时，系统调用会创建一个新的信号文件描述符（显然，我们应该首先以这种方式调用它）。第二个参数mask是信号mask - 这个信号描述符将与之关联的信号集。与sigwait*API 一样，人们期望通过sigprocmask(2)来阻止这些信号。

重要的是要理解，signalfd(2)系统调用本身不是一个阻塞调用。阻塞行为只有在调用与文件相关的 API 时才会发生，比如read(2)、select(2)或poll(2)。只有在信号集中的一个信号被传递给调用进程（或者已经挂起在它上面）时，文件相关的 API 才会返回。

signalfd(2)的第三个参数是一个flags值 - 一种改变默认行为的方式。只有从 Linux 内核版本 2.6.27 开始，flags才能正常工作；可能的值如下：

SFD_NONBLOCK：在信号描述符上使用非阻塞 I/O 语义（相当于fcntl(2)的O_NONBLOCK）。
SFD_CLOEXEC：如果进程通过exec系列 APIs 执行另一个进程，确保关闭信号描述符（这对安全性很重要，否则，所有前任进程的打开文件都会在执行操作中继承到后继进程；相当于open(2)的FD_CLOEXEC）。

就返回值而言，signalfd(2) API 在成功时返回新创建的信号描述符；当然，如果第一个参数是-1 的话。如果不是，那么它应该是一个已经存在的信号描述符；然后，成功时返回这个值。失败时，像往常一样，返回-1，并且errno变量反映了诊断信息。

在这里，我们将限制使用signalfd(2)来通过熟悉的read(2)系统调用读取信号信息的讨论；这次是在signalfdAPI 返回的信号描述符上。

read(2)的工作原理简而言之（read(2)在附录 A中有详细介绍，文件 I/O 基础）：我们将要读取的文件（在本例中是信号）描述符作为第一个参数，刚读取的数据的缓冲区作为第二个参数，要读取的最大字节数作为第三个参数：

ssize_t read(int fd, void *buf, size_t count);

这些是常见的typedefs：size_t本质上是一个无符号长整型

ssize_t本质上是一个有符号长整型

这里的第二个参数很特别：指向一个或多个signalfd_siginfo类型的结构的指针。struct signalfd_siginfo与我们在前面的siginfo_t 结构部分中详细介绍的siginfo_t非常类似。有关到达的信号的详细信息将在这里填充。

我们将有兴趣的读者从signalfd(2)的 man 页面中获取signalfd_siginfo数据结构的详细信息：linux.die.net/man/2/signalfd。该页面还包含一个小的示例程序。

read 的第三个参数，大小，在这种情况下必须至少是 sizeof(signalfd_siginfo)字节。

总结

在本章中，读者已经了解了一些关于信号的高级细节：如何通过适当的致命信号捕获来处理崩溃进程，以及在处理程序中获取关键细节，包括 CPU 寄存器等。通过学习解释强大的siginfo_t数据结构来实现这一点。此外，还涵盖了处理errno变量时的竞争情况，以及学习如何正确休眠。

实时信号及其与常规 Unix 信号的区别已经涵盖；然后，有关向其他进程发送信号的不同方式的部分。最后，我们看了一下通过同步阻塞一组信号来处理信号（使用各种 API）。

在下一章第十三章 定时器中，我们将利用我们在这里（以及前一章第十一章 信号-第一部分中获得的知识，并学习如何有效地设置和使用定时器。

第十三章：计时器

计时器使我们能够设置一个工件，当指定的时间到期时，操作系统会通知我们——这是一个普遍的应用程序（甚至是内核）特性。当然，计时器通常只有在与应用程序逻辑并行运行时才有用；这种异步通知行为是通过不同的方式实现的，很多时候是通过内核发送相关进程信号来实现的。

在本章中，我们将探讨 Linux 上用于设置和使用计时器的可用接口。这些接口分为两大类——较旧的 API（alarm(2)、[get|set]itimer(2)）和闪亮的新 POSIX API（timer_create(2)、timer_[set|get]time(2)等）。当然，由于信号与计时器一起被广泛使用，我们也会使用信号接口。

我们还想指出，由于计时器的固有动态特性，静态地查看我们书中示例程序的输出是不够的；像往常一样，我们强烈建议读者克隆本书的 GitHub 存储库并自己尝试代码。

在本章中，读者将学习使用 Linux 内核提供的各种计时器接口（API）。我们首先介绍较旧的接口，尽管它们有一些限制，但在系统软件中仍然被广泛使用，因为需要。我们编写了一个简单的命令行界面（CLI）-仅数字时钟程序，并使用这些 API 进行分析。然后我们将读者引入更近期和功能强大的 POSIX 计时器 API 集。展示和研究了两个非常有趣的示例程序——一个“你有多快能反应”的游戏和一个跑步间隔计时器应用程序。最后简要提到了通过文件抽象使用计时器 API 以及看门狗计时器是什么。

较旧的接口

如前所述，较旧的接口包括以下内容：

alarm(2)系统调用
间隔计时器[get|set]itimer(2)系统调用 API

让我们从它们中的第一个开始。

老式的闹钟

alarm(2)系统调用允许进程设置一个简单的超时机制；其签名如下：

#include <unistd.h>
unsigned int alarm(unsigned int seconds);

这是相当不言自明的。让我们举一个简单的例子：一个进程想要设置一个在三秒后到期的计时器，所以alarm(3)基本上就是用来做这个的代码。

在上述代码中到底发生了什么？在发出警报系统调用后三秒钟，也就是在定时器被装备后，内核将向进程发送信号SIGALRM。

SIGALRM（在 x86 上是信号＃14）的默认操作是终止进程。

因此，我们期望开发人员捕获信号（最好通过sigaction(2)系统调用，如前面的第十一章和第十二章中所深入讨论的那样）。

如果传递给alarm的参数是0，则任何待处理的alarm(2)都将被取消（实际上，当调用alarmAPI 时，无论如何都会发生这种情况）。

请注意，alarmAPI 不同寻常地返回一个无符号整数（因此不能返回-1，这是通常的失败情况）。相反，它返回任何先前编程的超时秒数，如果没有挂起的超时，则返回零。

接下来是一个简单的程序（ch13/alarm1.c），演示了alarm(2)的基本用法；参数指定了超时的秒数。

为了可读性，以下仅显示源代码的关键部分；要查看完整的源代码、构建它并运行它，可以从 GitHub 克隆整个树：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux。

信号捕获和计时器装备代码如下所示：

[...]
/* Init sigaction to defaults via the memset,
 * setup 'sig_handler' as the signal handler function,
 * trap just the SIGALRM signal.
 */
 memset(&act, 0, sizeof(act));
 act.sa_handler = sig_handler;
 if (sigaction(SIGALRM, &act, 0) < 0)
     FATAL("sigaction on SIGALRM failed");

 alarm(n);
 printf("A timeout for %ds has been armed...\n", n);
 pause(); /* wait for the signal ... */

内核向进程分发SIGALRM信号后会发生什么；也就是说，一旦定时器超时了？信号处理程序当然会运行。在这里：

static void sig_handler(int signum)
{
    const char *str = " *** Timeout! [SIGALRM received] ***\n";
    if (signum != SIGALRM)
        return;
    if (write(STDOUT_FILENO, str, strlen(str)) < 0)
        WARN("write str failed!");
}

这里有一个快速的构建和测试运行：

$ make alarm1
gcc -Wall -UDEBUG -c ../common.c -o common.o
gcc -Wall -UDEBUG -c alarm1.c -o alarm1.o
gcc -Wall -UDEBUG -o alarm1 alarm1.o common.o 
$ ./alarm1 
Usage: ./alarm1 seconds-to-timeout(>0)
$ ./alarm1 3
A timeout for 3s has been armed...
    *** Timeout! [SIGALRM received] ***            *<< 3 seconds later! >>*
$

我们现在增强了先前的代码（ch13/alarm1.c）以使超时持续重复（源文件是ch13/alarm2_rep.c）；已更改的相关代码片段如下：

[...]
alarm(n);
printf("A timeout for %ds has been armed...\n", n);
/* (Manually) re-invoke the alarm every 'n' seconds */
while (1) {
    pause(); /* wait for the signal ... */
    alarm(n);
    printf(" Timeout for %ds has been (re)armed...\n", n);
}
[...]

虽然这里不适用，但要意识到调用alarm(2)会自动取消任何先前挂起的超时。快速试运行如下：

$ ./alarm2_rep 1
A timeout for 1s has been armed...
 *** Timeout! [SIGALRM received] ***
 Timeout for 1s has been (re)armed...
 *** Timeout! [SIGALRM received] ***
 Timeout for 1s has been (re)armed...
 *** Timeout! [SIGALRM received] ***
 Timeout for 1s has been (re)armed...
 *** Timeout! [SIGALRM received] ***
 Timeout for 1s has been (re)armed...
^C
$

警报现在重复（在上面的示例运行中，每秒一次）。还要注意我们如何用键盘Ctrl+C（发送SIGINT，因为我们没有捕获它，所以只终止前台进程）杀死进程。

Alarm API - 令人沮丧

现在我们已经看过使用（简单的）alarm(2)API，重要的是要意识到它有一些缺点：

非常粗糙的粒度超时（在现代处理器上是非常长的一秒！）
不可能同时运行多个超时
不可能在以后的时间点查询或修改超时值-尝试这样做将取消它
混合以下 API 可能会导致问题/冲突（在下面，后一个 API 可能是使用前一个 API 内部实现的）
alarm(2)和setitimer(2)
alarm(2)和sleep(3)
总是可能超时发生比预期晚（超时）

随着我们在本章中的进展，我们将发现更强大的函数可以克服大部分这些问题。（嗯，公平地说，可怜的alarm(2)确实有一个好处：对于简单的目的，它非常快速和容易使用！）

间隔计时器

间隔计时器 API 允许进程设置和查询可以按固定时间间隔自动重复的计时器。相关的系统调用如下：

#include <sys/time.h>
int getitimer(int which, struct itimerval *curr_value);
int setitimer(int which, const struct itimerval *new_value,
                struct itimerval *old_value);

显然，setitimer(2)用于设置新的计时器；getitimer(2)可用于查询它，并返回剩余时间。

两者的第一个参数都是which，它指定要使用的计时器类型。Linux 允许我们使用三种间隔计时器类型：

ITIMER_REAL：使用此计时器类型在实时中倒计时，也称为挂钟时间。计时器到期时，内核会向调用进程发送信号SIGALRM。
ITIMER_VIRTUAL：使用此计时器类型在虚拟时间中倒计时；也就是说，只有当调用进程（所有线程）在 CPU 上运行在用户空间时，计时器才会倒计时。计时器到期时，内核会向调用进程发送信号SIGVTALRM。
ITIMER_PROF：使用此计时器类型也在虚拟时间中倒计时；这时，当调用进程（所有线程）在 CPU 上运行在用户空间和/或内核空间时，计时器会倒计时。计时器到期时，内核会向调用进程发送信号SIGPROF。

因此，要使计时器在特定时间过期时到期，请使用第一个；可以使用剩下的两种类型来对进程的 CPU 使用情况进行分析。每种类型的计时器一次只能使用一个（后面将详细介绍）。

要检查的下一个参数是itimerval数据结构（以及它的内部timeval结构成员；两者都在time.h头文件中定义）：

struct itimerval {
    struct timeval it_interval;    /* Interval for periodic timer */
    struct timeval it_value;       /* Time until next expiration */
};

struct timeval {
    time_t      tv_sec;            /* seconds */
    suseconds_t tv_usec;           /* microseconds */
};

（顺便说一句，内部的time_t和suseconds_ttypedefs 都转换为长整型值。）

正如我们所看到的，这是setitimer(2)的第二个参数，它是指向名为new_value的结构体itimerval的指针，用于指定新计时器的到期时间，例如：

在it_value结构成员中，放置初始超时值。该值随着计时器的运行而减少，并且在某个时候将变为零；在这一点上，与计时器类型对应的适当信号将被传递给调用进程。
在上一步之后，将检查it_interval结构成员。如果它不为零，则该值将被复制到it_value结构中，导致定时器有效地自动重置并再次运行该时间量；换句话说，这就是 API 如何实现间隔定时器角色的方式。

此外，明确指出，时间到期以秒:微秒表示。

例如，如果我们想要每秒重复（间隔）超时，我们需要将结构初始化如下：

struct itimerval mytimer;
memset(&mytimer, 0, sizeof(struct itimerval));
mytimer.it_value.tv_sec = 1;
mytimer.it_interval.tv_sec = 1;
setitimer(ITIMER_REAL, &mytimer, 0);

（出于清晰起见，错误检查代码未在上述代码中显示。）这正是在接下来的简单数字时钟演示程序中完成的。

存在一些特殊情况：

要取消（或解除武装）定时器，请将it_timer结构的两个字段都设置为零，并调用setitimer(2)API。
要创建一个单次定时器——即，到期后仅一次——将it_interval结构的两个字段都初始化为零，然后调用setitimer(2)API。
如果setitimer(2)的第三个参数为非 NULL，则将在此处返回先前的定时器值（就好像调用了getitmer(2)API 一样）。

与通常一样，这对系统调用在成功时返回0，在失败时返回-1（并适当设置errno）。

由于每种类型的定时器到期时会生成一个信号，因此在给定进程中只能同时运行每种类型的定时器的一个实例。如果我们尝试设置多个相同类型的定时器（例如，ITIMER_REAL），则总是可能会将多个相同信号的实例（在本例中为SIGALRM）同时传递给进程——并且传递给相同的处理程序例程。正如我们在第十一章和第十二章中学到的那样，信号-第一部分和信号-第二部分，常规的 Unix 信号不能排队，因此信号实例可能会被丢弃。实际上，在给定进程中最好（也最安全）同时使用每种类型的定时器的一个实例。

下表对比了我们之前看到的简单alarm(2)系统调用 API 和我们刚刚看到的更强大的[set|get]itimer(2)间隔定时器 API：

特性	简单定时器 [`alarm(2)`]	间隔定时器 [`setitimer(2)`, `getitimer(2)`]
粒度（分辨率）	非常粗糙；1 秒	很好的粒度；理论上为 1 微秒（实际上，在 2.6.16 HRT[1]之前通常为毫秒）
查询剩余时间	不可能	是的，使用`getitimer(2)`
修改超时	不可能	是的
取消超时	是	是
自动重复	不，但可以手动设置	是的
多个定时器	不可能	是的，但每个进程最多三个——每种类型一个（实时、虚拟和分析）

表 1：简单alarm(2)API 和间隔定时器的快速比较

[1] 高分辨率定时器（HRT）；从 Linux 2.6.16 开始实现。在 GitHub 存储库的进一步阅读部分中有一篇详细论文的链接。

没有应用的知识有什么用？让我们尝试一下间隔定时器 API。

一个简单的 CLI 数字时钟

我们人类非常习惯看到时钟每秒滴答一次。为什么不编写一个快速的 C 程序，模拟一个（非常简单的命令行）数字时钟，必须每秒显示我们正确的日期和时间！（嗯，个人而言，我更喜欢看到老式的模拟时钟，但是，嘿，这本书并没有涉及执行图形绘图的密切保密的秘密口诀。）

我们实现这一点非常简单，实际上：我们设置一个每秒超时一次的间隔定时器。下面是演示相当强大的setitimer(2)API 的基本用法的程序（ch13/intv_clksimple.c）。

为了可读性，以下仅显示了源代码的关键部分；要查看完整的源代码，构建并运行它，整个树都可以从 GitHub 克隆到这里：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux。

信号捕获和设置单秒间隔定时器如下所示：

static volatile sig_atomic_t opt;
[...]
int main(int argc, char **argv)
{
    struct sigaction act;
    struct itimerval mytimer;
[...]
    memset(&act, 0, sizeof(act));
    act.sa_handler = ticktock;
    sigfillset(&act.sa_mask); /* disallow all signals while handling */
    /*
    * We deliberately do *not* use the SA_RESTART flag;
    * if we do so, it's possible that any blocking syscall gets
    * auto-restarted. In a timeout context, we don't want that
    * to happen - we *expect* a signal to interrupt our blocking
    * syscall (in this case, the pause(2)).
    * act.sa_flags = SA_RESTART;
    */
    if (sigaction(SIGALRM, &act, 0) < 0)
        FATAL("sigaction on SIGALRM failed");
    /* Setup a single second (repeating) interval timer */
    memset(&mytimer, 0, sizeof(struct itimerval));
    mytimer.it_value.tv_sec = 1;
 mytimer.it_interval.tv_sec = 1;
    if (setitimer(ITIMER_REAL, &mytimer, 0) < 0)
        FATAL("setitimer failed\n");
    while (1)
        (void)pause();

请注意，关于为什么我们通常在处理传递超时的信号时不使用SA_RESTART标志的自解释注释。

设置间隔定时器很容易：我们初始化itimerval结构，将其中的秒成员设置为1（微秒部分保持为零），然后发出setitimer(2)系统调用。定时器被装载——它开始倒计时。当一秒钟过去后，内核将向进程传递SIGALRM信号（因为定时器类型是ITIMER_REAL）。信号处理程序ticktock将执行获取并打印当前时间戳的任务（请参见其代码如下）。由于间隔组件被设置为1，定时器将自动重复每秒触发一次。

static void ticktock(int signum)
{
    char tmstamp[128];
    struct timespec tm;
    int myerrno = errno;

    /* Query the timestamp ; both clock_gettime(2) and
     * ctime_r(3) are reentrant-and-signal-safe */
    if (clock_gettime(CLOCK_REALTIME, &tm) < 0)
        FATAL("clock_gettime failed\n");
    if (ctime_r(&tm.tv_sec, &tmstamp[0]) == NULL)
        FATAL("ctime_r failed\n");

    if (opt == 0) {
        if (write(STDOUT_FILENO, tmstamp, strlen(tmstamp)) < 0)
            FATAL("write failed\n");
    } else if (opt == 1) {
      /* WARNING! Using the printf / fflush here in a signal handler is
       * unsafe! We do so for the purposes of this demo app only; do not
       * use in production.
       */
        tmstamp[strlen(tmstamp) - 1] = '\0';
        printf("\r%s", tmstamp);
        fflush(stdout);
    }
    errno = myerrno;
}

前面的信号处理程序例程每秒调用一次（当然，内核在定时器到期时向进程传递SIGALRM信号）。这个例程的工作很明确：它必须查询并打印当前日期时间；也就是时间戳。

获取当前时间

查询当前时间乍一看似乎很简单。许多程序员使用以下 API 序列来实现它：

time(2)
localtime(3)
strftime(3)

我们不这样做。为什么呢？回想一下我们在第十一章《信号-第一部分》中对异步信号安全（可重入）函数的讨论（在“可重入安全性和信号”部分）。在前面提到的三个 API 中，只有time(2) API 被认为是信号安全的；其他两个则不是（也就是说，它们不应该在信号处理程序中使用）。相关的 man 页面（signal-safety(7)）证实了这一点。

因此，我们使用文档化的异步信号安全 API——time(2)、clock_gettime(2)和ctime_r(3)——来安全地获取时间戳的角色。以下是它们的快速查看。

clock_gettime(2)系统调用的签名如下：

int clock_gettime(clockid_t clk_id, struct timespec *tp);

第一个参数是要使用的时钟源或时钟类型；事实上，Linux 操作系统（和 glibc）支持许多不同的内置时钟类型；其中包括以下几种：

CLOCK_REALTIME：系统范围的挂钟时钟（实时）；使用它来查询时间戳。
CLOCK_MONOTONIC：单调时钟按一个方向计数（显然是向上；通过时间倒流是一项仍在被疯狂（或者是吗？）的科学家们研究的功能）。它通常计算自系统启动以来经过的时间。
CLOCK_BOOTTIME（从 Linux 2.6.39 开始）：这与CLOCK_MONOTONIC几乎相同，只是它考虑了系统暂停的时间。
CLOCK_PROCESS_CPUTIME_ID：衡量给定进程的所有线程在 CPU 上花费的 CPU 时间（通过 PID；使用clock_getcpuclockid(3) API 来查询）。
CLOCK_THREAD_CPUTIME_ID：衡量特定线程在 CPU 上花费的 CPU 时间（使用pthread_getcpuclockid(3) API 来查询）。

还有更多；请参考clock_gettime(2)的 man 页面以获取详细信息。对于我们当前的目的，CLOCK_REALTIME是我们要使用的时钟类型。

clock_gettime(2)的第二个参数是一个值-结果风格的参数；实际上，这是一个返回值。在成功返回时，它将保存timeval结构中的时间戳；该结构在time.h头文件中定义，并以秒和纳秒的形式保存当前时间戳：

struct timespec {
    time_t tv_sec; /* seconds */
    long tv_nsec; /* nanoseconds */
 };

我们对秒数的值将会非常满意。

但是这个秒和纳秒的值是如何解释的呢？在 Unix 宇宙中，这实际上非常常见：Unix 系统将时间存储为自 1970 年 1 月 1 日午夜（00:00）以来经过的秒数——可以将其视为 Unix 的诞生！这个时间值被称为自纪元以来的时间或 Unix 时间。好吧，今天它将是一个相当大的秒数，对吧？那么如何以人类可读的格式表示它呢？我们很高兴你问，因为这正是ctime_r(3)API 的工作：

char *ctime_r(const time_t *timep, char *buf);

第一个参数将是我们从clock_gettime(2)API 返回的time_t成员的指针；再次，第二个参数是一个值结果式的返回——成功完成时，它将保存可读的时间戳！请注意，为缓冲区buf分配内存（并根据需要释放）是应用程序员的工作。在我们的代码中，我们只使用静态分配的本地缓冲区。（当然，我们对所有 API 执行错误检查。）

最后，根据用户传递的opt值，我们要么使用（安全的）write(2)系统调用，要么使用（不安全的！）printf(3)/fflush(3)API 来打印当前时间。

代码printf("\r%s", tmstamp);使用了\r格式的printf(3)——这是回车，它有效地将光标带回到同一行的开头。这给人一种不断更新的时钟的外观。这很好，除了使用printf(3)本身是不安全的！

试运行

这是一个试运行，首先使用信号安全的write(2)方法：

$ ./intv_clksimple
Usage: ./intv_clksimple {0|1}
 0 : the Correct way (using write(2) in the signal handler)
 1 : the *Wrong* way (using printf(3) in the signal handler) *@your risk*
$ ./intv_clksimple 0
Thu Jun 28 17:52:38 2018
Thu Jun 28 17:52:39 2018
Thu Jun 28 17:52:40 2018
Thu Jun 28 17:52:41 2018
Thu Jun 28 17:52:42 2018
^C
$

现在，这是一个使用信号不安全的printf(3)/fflush(3)方法的试运行：

$ ./intv_clksimple 1
 *WARNING* [Using printf in signal handler]
Thu Jun 28 17:54:53 2018^C
$

看起来更好，时间戳不断刷新在同一行上，但是不安全。这本书无法向您展示，亲爱的读者，回车样式的printf("\r...")的愉快效果。在您的 Linux 系统上尝试一下，看看自己。

我们知道在信号处理程序中使用printf(3)和fflush(3)API 是不好的编程实践——它们不是异步信号安全的。

但是，如果低级设计规范要求我们确切使用这些 API 呢？好吧，总是有办法：为什么不重新设计程序，使用其中一个同步阻塞 API 来等待和捕获信号（请记住，当捕获致命信号如SIGILL、SIGFPE、SIGSEGV和SIGBUS时，建议使用通常的异步sigaction(2)API）：sigwait(3)、sigwaitinfo(2)、sigtimedwait(2)甚至是signalfd(2)API（我们在第十二章中介绍过，信号-第二部分，通过 sigwait 同步阻塞信号的 API）。我们把这留给读者作为练习。

关于使用分析计时器的一些话

我们已经比较详细地探讨了ITIMER_REAL计时器类型的使用——它按实时倒计时。那么，使用另外两种——ITIMER_VIRTUAL和ITIMER_PROF——计时器呢？嗯，代码风格非常相似；没有什么新东西。对于新手开发人员来说，面临的问题是：信号可能根本不会到达！

让我们看一个使用ITIMER_VIRTUAL计时器的简单代码片段：

static void profalrm(int signum)
{
    /* In production, do Not use signal-unsafe APIs like this! */
    printf("In %s:%d sig=%d\n", __func__, __LINE__, signum);
}

[...]

// in main() ...

struct sigaction act;
struct itimerval t1;

memset(&act, 0, sizeof(act));
act.sa_handler = profalrm;
sigfillset(&act.sa_mask); /* disallow all signals while handling */
if (sigaction(SIGPROF, &act, 0) < 0)
    FATAL("sigaction on SIGALRM failed");

[...]

memset(&t1, 0, sizeof(struct itimerval));
t1.it_value.tv_sec = 1;
t1.it_interval.tv_sec = 1;
if (setitimer(ITIMER_PROF, &t1, 0) < 0)
    FATAL("setitimer failed\n");

while (1)
    (void)pause();

运行时，没有输出出现——计时器似乎没有工作。

这真的不是这种情况——它正在工作，但问题在于：这个进程仅通过pause(2)来睡眠。在睡眠时，它不在 CPU 上运行；因此，内核几乎没有减少（前面提到的，每秒）间隔计时器！请记住，只有当进程在 CPU 上运行时，ITIMER_VIRTUAL和ITIMER_PROF计时器才会递减（或倒计时）。因此，一秒钟的计时器实际上从未到期，SIGPROF信号也从未发送。

因此，现在解决之前问题的方法变得明显：让我们在程序中引入一些 CPU 处理，并减少超时值。我们可靠的DELAY_LOOP_SILENT宏（参见源文件common.h）使进程在一些愚蠢的逻辑上旋转——重点是它变得 CPU 密集。此外，我们已经将定时器到期减少为每个进程在 CPU 上花费 10 毫秒：

[...]
memset(&t1, 0, sizeof(struct itimerval));
t1.it_value.tv_sec = 0;
t1.it_value.tv_usec = 10000;       // 10,000 us = 10 ms
t1.it_interval.tv_sec = 0;
t1.it_interval.tv_usec = 10000;    // 10,000 us = 10 ms
if (setitimer(ITIMER_PROF, &t1, 0) < 0)
    FATAL("setitimer failed\n");

while (1) {
    DELAY_LOOP_SILENT(20);
    (void)pause();
}

这一次，运行时，我们看到了这个：

In profalrm:34 sig=27
In profalrm:34 sig=27
In profalrm:34 sig=27
In profalrm:34 sig=27
In profalrm:34 sig=27
...

性能分析定时器确实在工作。

更新的 POSIX（间隔）定时器机制

在本章前面，我们在表 1：简单 alarm(2) API 和间隔定时器的快速比较中看到，尽管间隔定时器[get|set]itimer(2)API 优于简单的alarm(2)API，但它们仍然缺乏重要的现代功能。现代 POSIX（间隔）定时器机制解决了一些缺点，其中一些如下：

通过增加纳秒粒度定时器（通过在 2.6.16 Linux 内核中集成的与架构无关的 HRT 机制）来改善分辨率一千倍。
一种通用的sigevent(7)机制——这是一种处理异步事件的方式，例如定时器到期（我们的用例）、AIO 请求完成、消息传递等——来处理定时器到期。我们现在不再被迫将定时器到期与信号机制绑定。
重要的是，一个进程（或线程）现在可以设置和管理任意数量的定时器。
最终，总是有一个上限：在这种情况下，它是资源限制RLIMIT_SIGPENDING。（更技术上地说，事实是操作系统为每个创建的定时器分配了一个排队的实时信号，这就是限制。）

这些观点将如下所述，继续阅读。

典型的应用程序工作流程

设置和使用现代 POSIX 定时器的设计方法（和使用的 API）如下；顺序通常如下所示：

信号设置。
假设正在使用的通知机制是信号，首先通过sigaction(2)捕获信号。
创建和初始化定时器。
决定使用哪种时钟类型（或源）来测量经过的时间。
决定应用程序使用的定时器到期事件通知机制——通常是使用（通常的）信号还是（新生成的）线程。
上述决策通过timer_create(2)系统调用实现；因此它允许创建一个定时器，当然，我们可以多次调用它来创建多个定时器。
使用timer_settime(2)来装载（或解除装载）特定的定时器。装载定时器意味着有效地启动它运行——倒计时；解除装载定时器则相反——停止它。
查询特定定时器的剩余时间（到期时间）（及其间隔设置）使用timer_gettime(2)。
使用timer_getoverrun(2)检查给定定时器的超时计数。
使用timer_delete(2)删除（显然也是解除装载）定时器。

创建和使用 POSIX（间隔）定时器

如前所述，我们使用强大的timer_create(2)系统调用为调用进程（或线程）创建定时器：

#include <signal.h>
#include <time.h>
int timer_create(clockid_t clockid, struct sigevent *sevp,
                 timer_t *timerid);
Link with -lrt.

我们必须链接实时（rt）库来使用这个 API。librt库实现了 POSIX.1b 对 POSIX 接口的实时扩展。在 GitHub 存储库的进一步阅读部分中找到librtman 页面的链接。

传递给timer_create(2)的第一个参数通知操作系统要使用的时钟源；我们避免重复这个问题，并参考本章前面涵盖的获取当前时间部分，其中我们列举了 Linux 中常用的几种时钟源。（另外，正如在那里指出的，可以参考clock_gettime(2)的 man 页面获取更多细节。）

传递给timer_create(2)的第二个参数很有趣：它提供了一种通用的方式来指定应用程序使用的计时器到期事件通知机制！为了理解这一点，让我们来看看sigevent结构：

#include <signal.h>

union sigval {     /* Data passed with notification */
    int sival_int;      /* Integer value */
    void *sival_ptr;    /* Pointer value */
 };

struct sigevent {
    int sigev_notify;         /* Notification method */
    int sigev_signo;          /* Notification signal */
    union sigval sigev_value; /* Data passed with notification */
    void (*sigev_notify_function) (union sigval);
    /* Function used for thread notification (SIGEV_THREAD) */
    void *sigev_notify_attributes; /* Attributes for notification 
    thread(SIGEV_THREAD) */
    pid_t sigev_notify_thread_id;
             /* ID of thread to signal (SIGEV_THREAD_ID) */
 };

（回想一下，我们已经在第十一章和第十二章中使用了union sigval机制，将一个值传递给信号处理程序。信号-第一部分和信号-第二部分。）

sigev_notify成员的有效值在以下枚举：

通知方法：`sigevent.sigev_notify`	意义
`SIGEV_NONE`	事件到达时不执行任何操作-空通知
`SIGEV_SIGNAL`	通过发送进程中`sigev_signo`成员中指定的信号来通知
`SIGEV_THREAD`	通过调用（实际上是生成）一个（新的）线程，其函数为`sigev_notify_function`，传递给它的参数是`sigev_value`，如果`sigev_notify_attributes`不为 NULL，则应该是新线程的`pthread_attr_t`结构。（读者们，请注意，我们将在后续章节中详细介绍多线程。）
`SIGEV_THREAD_ID`	仅在 Linux 中使用，用于指定在计时器到期时将运行的内核线程；实际上，只有线程库才使用此功能。

表 2：使用 sigevent(7)机制

在第一种情况下，SIGEV_NONE，可以始终通过timer_gettime(2)API 手动检查计时器是否到期。

更有趣和常见的情况是第二种情况，SIGEV_SIGNAL。在这里，信号被传递给计时器已经到期的进程；进程的sigaction(2)处理程序的siginfo_t数据结构被适当地填充；对于我们的用例-使用 POSIX 计时器-如下：

si_code（或信号来源字段）设置为值SI_TIMER，表示 POSIX 计时器已经到期（在sigaction的 man 页面中查找其他可能性）
si_signo设置为信号编号（sigev_signo）
si_value将是union sigev_value中设置的值

对于我们的目的（至少在本章中），我们只考虑将sigevent通知类型设置为值SIGEV_SIGNAL（因此设置要在sigev_signo成员中传递的信号）。

传递给timer_create(2)的第三个参数，timer_t *timerid，是一个（现在常见的）值结果样式的参数；实际上，它是新创建的 POSIX 计时器的返回 ID！当然，系统调用在失败时返回-1（并相应设置errno），成功时返回0。timerid是计时器的句柄-我们通常将其作为参数传递给后续的 POSIX 计时器 API，以指定要操作的特定计时器。

军备竞赛-启动和停止 POSIX 计时器

如前所述，我们使用timer_settime(2)系统调用来启动或停止计时器：

#include <time.h>
int timer_settime(timer_t timerid, int flags,
                    const struct itimerspec *new_value,
                    struct itimerspec *old_value);
Link with -lrt.

由于可以同时运行多个并发的 POSIX 计时器，因此我们需要准确指定我们正在引用的计时器；这是通过第一个参数timer_id完成的，它是计时器的 ID，并且是先前看到的timer_create(2)系统调用的有效返回。

这里使用的重要数据结构是itimerspec；其定义如下：

struct timespec {
    time_t tv_sec; /* Seconds */
    long tv_nsec;  /* Nanoseconds */
};

struct itimerspec {
    struct timespec it_interval; /* Timer interval */
    struct timespec it_value;    /* Initial expiration */
};

因此，很明显：在第三个参数中，指向名为new_value的itimerspec结构的指针：

我们可以将时间指定到（理论上的）纳秒分辨率！请注意，时间是相对于由timer_create(2)API 指定的时钟源来测量的。
这提醒我们，可以始终使用clock_getres(2)API 查询时钟分辨率。
关于初始化it_value（timespec结构）：
将其设置为非零值以指定初始计时器到期值。
将其设置为零以指定我们正在解除（停止）计时器。
如果这个结构已经保存了一个正值，那么它将被覆盖，并且定时器将使用新值重新启动。
不仅如此，通过将it_interval（timespec 结构）初始化为非零值，我们将设置一个重复的间隔定时器（因此称为 POSIX 间隔定时器）；时间间隔就是它初始化的值。定时器将持续无限期地触发，直到它被解除武装或删除。如果相反，这个结构被清零，定时器就变成了一次触发的定时器（当 it_value 成员中指定的时间过去时只触发一次）。

通常，将flags值设置为0——timer_settime(2)的 man 页面指定了一个可以使用的附加标志。最后，第四个参数old_value（同样是指向struct itimerspec的指针）的工作如下：

如果为0，则会被简单地忽略。
如果非零，则是查询到给定定时器到期的剩余时间的一种方法。
到期时间将在old_value->it_value成员中返回（以秒和纳秒为单位），设置的间隔将在old_value->it_interval成员中返回。

预期的成功返回值为0，失败时为-1（并适当设置了errno）。

查询定时器

可以随时查询给定的 POSIX 定时器，以获取剩余时间到定时器到期的时间，使用timer_gettime(2)系统调用 API；其签名如下：

#include <time.h>
int timer_gettime(timer_t timerid, struct itimerspec *curr_value);

显然，传递给timer_gettime(2)的第一个参数是要查询的特定定时器的 ID，传递的第二个参数是值结果样式返回——到期时间以它返回（在itimerspec类型的结构中）。

正如我们从前面所知道的，struct itimerval本身由两个timespec类型的数据结构组成；剩余时间到定时器到期将被放置在curr_value->it_value成员中。如果这个值为 0，则意味着定时器已经停止（解除武装）。如果放置在

curr_value->it_interval成员为正值时，表示定时器将重复触发的间隔（在第一次超时后）；如果为 0，则意味着定时器是单次触发的（没有重复超时）。

示例代码片段显示工作流程

在接下来的内容中，我们展示了来自我们的样本程序ch13/react.c的代码片段（在下一节中更多地了解这个相当有趣的反应时间游戏应用程序），它清楚地说明了先前描述的步骤序列。

设置信号：
假设正在使用的通知机制是信号，首先通过sigaction(2)捕获信号如下：

struct sigaction act;
[...]
// Trap SIGRTMIN : delivered on (interval) timer expiry
memset(&act, 0, sizeof(act));
act.sa_flags = SA_SIGINFO | SA_RESTART;
act.sa_sigaction = timer_handler;
if (sigaction(SIGRTMIN, &act, NULL) == -1)
    FATAL("sigaction SIGRTMIN failed\n");

创建和初始化定时器：
决定使用的时钟类型（或来源）来测量经过的时间：
我们使用实时时钟CLOCK_REALTIME作为我们的定时器来源，系统范围的挂钟时间。
决定应用程序使用的定时器到期事件通知机制——通常是使用（通常的）信号还是（新生成的）线程。
我们使用信号作为定时器到期事件通知机制。
上述决定是通过timer_create(2)系统调用实现的，它允许创建一个定时器；当然，我们可以多次调用它来创建多个定时器：

struct sigevent sev;
[...]
/* Create and init the timer */
sev.sigev_notify = SIGEV_SIGNAL;
sev.sigev_signo = SIGRTMIN;
sev.sigev_value.sival_ptr = &timerid;
if (timer_create(CLOCK_REALTIME, &sev, &timerid) == -1)
    FATAL("timer_create failed\n");

使用timer_settime(2)API 来启动（或解除武装）特定的定时器。启动定时器意味着有效地开始计时或倒计时；解除武装定时器则相反——停止它的运行：

static struct itimerspec itv;    // global
[...]
static void arm_timer(timer_t tmrid, struct itimerspec *itmspec)
{
    VPRINT("Arming timer now\n");
    if (timer_settime(tmrid, 0, itmspec, NULL) == -1)
        FATAL("timer_settime failed\n");
    jumped_the_gun = 0;
}
[...]
printf("Initializing timer to generate SIGRTMIN every %ld ms\n",
 freq_ms);
memset(&itv, 0, sizeof(struct itimerspec));
itv.it_value.tv_sec = (freq_ms * 1000000) / 1000000000;
itv.it_value.tv_nsec = (freq_ms * 1000000) % 1000000000;
itv.it_interval.tv_sec = (freq_ms * 1000000) / 1000000000;
itv.it_interval.tv_nsec = (freq_ms * 1000000) % 1000000000;
[...]
arm_timer(timerid, &itv);

要查询特定定时器的剩余时间（到期时间）和其间隔设置，请使用timer_gettime(2)

这在这个特定的应用程序中没有执行。

使用timer_getoverrun(2)检查给定定时器的超时计数

在下一节“计算超时”中提供了此 API 的解释以及我们可能需要它的原因。

/* 
 * The realtime signal (SIGRTMIN) - timer expiry - handler.
 * WARNING! Using the printf in a signal handler is unsafe!
 * We do so for the purposes of this demo app only; do Not
 * use in production.
 */
static void timer_handler(int sig, siginfo_t * si, void *uc)
{
  char buf[] = ".";

  c++;
  if (verbose) {
      write(2, buf, 1);
#define SHOW_OVERRUN 1
#if (SHOW_OVERRUN == 1)
    {
          int ovrun = timer_getoverrun(timerid);
          if (ovrun == -1)
              WARN("timer_getoverrun");
          else {
              if (ovrun)
                  printf(" overrun=%d [@count=%d]\n", ovrun, c);
          }
    }
#endif
  }
}

使用timer_delete(2)删除（显然解除武装）一个定时器

这不是这个特定应用程序中执行的（因为进程退出当然会删除与进程相关的所有定时器）。

正如timer_create(2)的 man 手册所告诉我们的，关于 POSIX（间隔）定时器的一些要点如下：

在fork(2)之后，所有定时器都会自动解除武装；换句话说，定时器不会在子进程中继续到期。
在execve(2)之后，所有定时器都被删除，因此在后继进程中将不可见。
值得注意的一点是（从 Linux 3.10 内核开始），proc 文件系统可以用来查询进程拥有的定时器；只需查找 cat 伪文件/proc//timers 以查看它们（如果存在）。
从 Linux 4.10 内核开始，POSIX 定时器是一个内核可配置的选项（在内核构建时，默认情况下启用）。

正如我们反复提到的，man 手册是开发人员可用的非常宝贵和有用的资源；再次，timer_create(2)的 man 手册提供了一个很好的示例程序；我们敦促读者参考 man 手册，阅读它，构建它并尝试运行程序。

计算超限

假设我们使用信号作为事件通知机制来告诉我们 POSIX 定时器已经到期，并且假设定时器到期时间非常短（比如几十微秒）；例如，100 微秒。这意味着每 100 微秒信号将被传递给目标进程！

在这种情况下，可以合理地期望进程以如此高的速率接收相同的重复信号，不可能处理它。我们也知道，从我们对信号的了解来看，在类似这样的情况下，使用实时信号要远远优于使用常规 Unix 信号，因为操作系统有能力排队实时信号，但不能排队常规信号——它们（常规信号）将被丢弃，只保留一个实例。

因此，我们将使用实时信号（比如SIGRTMIN）来表示定时器到期；然而，即使使用一个非常小的定时器到期时间（例如，正如我们所说的 100 微秒），这种技术也不足以满足需求！进程肯定会被相同信号的快速传递所淹没。对于这些情况，我们可以获取定时器到期和实际信号处理之间发生的实际超限次数。我们该如何做到这一点？有两种方法：

一种是通过信号处理程序的siginfo_t->_timer->si_overrun成员（这意味着我们在使用 sigaction 捕获信号时指定了SA_SIGINFO标志）——这是超限计数。
然而，这种方法是特定于 Linux 的（不可移植）。获得超限计数的更简单、可移植的方法是使用timer_getoverrun(2)系统调用。这里的缺点是系统调用比内存查找的开销要大得多；就像生活中一样，有利的一面就有不利的一面。

POSIX 间隔定时器-示例程序

编程最终是通过实践来学习和理解的，而不仅仅是看或阅读。让我们听从自己的建议，编写一些体面的代码示例，以说明如何使用 POSIX（间隔）定时器 API。（当然，亲爱的读者，这意味着你也要这样做！）

第一个示例程序是一个小型 CLI 游戏“你的反应有多快”？第二个示例程序是一个简单的跑步计时器的实现。继续阅读了解更多细节。

反应-时间游戏

我们都知道现代计算机很快！当然，这是一个非常相对的说法。有多快？这是一个有趣的问题。

有多快？

在第二章中，虚拟内存，在内存金字塔部分，我们看到了表 2：内存层次结构数字。这里，对数字进行了代表性的查看-不同类型的内存技术（嵌入式和服务器空间）的典型访问速度在表中列举。

快速回顾给出了典型内存（和网络）访问速度的以下内容。当然，这些数字仅供参考，最新的硬件可能具有更优越的性能特征；这里，重点是概念：

CPU 寄存器	CPU 缓存	RAM	Flash	磁盘	网络往返
300 - 500 ps	0.5 ns（L1）至 20 ns（L3）	50-100 ns	25-50 us	5-10 ms	>= 100s of ms

表 3：硬件内存速度摘要表

这些延迟值大多是如此微小，以至于我们作为人类实际上无法将它们可视化（请参阅稍后的平均人类反应时间信息框）。所以，这带来了一个问题。我们人类究竟能够希望相当正确地可视化和理解哪些微小的数字？简短的答案是几百毫秒。

为什么要这样说？嗯，如果一个计算机程序告诉你尽快做出反应并立即按下某个键盘组合键，需要多长时间？所以，我们真正想要测试的是人对视觉刺激的反应时间。啊，通过编写这个精确的程序，我们可以通过实验证明这一点：一个反应计时器！

请注意，这个简单的视觉刺激反应测试并不被认为是科学的；我们完全忽略了重要的延迟产生机制，比如计算机系统硬件和软件本身。所以，当你尝试时，不要对结果感到沮丧！

我们的反应游戏-它是如何工作的

因此，在高层次上，这是程序的逐步计划（实际代码显示在下一节；我们建议您先阅读此内容，然后再查看代码）：

创建并初始化一个简单的警报；将其设置为在程序启动后的 1 到 5 秒之间的任意时间过期
警报过期的时刻，执行以下操作：
设置 POSIX（间隔）计时器（到第一个参数指定的频率）。
显示一条消息，要求用户在键盘上按下*Ctrl *+ C。
获取时间戳（我们称之为tm_start）。
当用户实际按下*^C*（*Ctrl *+ C；我们将通过sigaction(2)捕获到），再次获取时间戳（我们称之为tm_end）。
计算用户的反应时间（作为tm_end - tm_start）并显示它。

（注意前面的步骤遵循我们在本章前面描述的典型应用程序工作流程。）

此外，我们要求用户指定间隔计时器的间隔时间（第一个参数），以及作为第二个参数的可选详细选项。

进一步分解（更详细地），初始化代码执行以下操作：

通过sigaction(2)捕获信号：
SIGRTMIN：我们将使用信号通知来指定计时器到期；这是在我们的 POSIX 间隔计时器到期时生成的信号。
SIGINT：用户按下*^C*键盘组合时生成的信号。
SIGALRM：我们的初始随机警报过期时生成的信号
设置 POSIX 间隔计时器：
初始化sigevent结构。
创建计时器（使用实时时钟源）并用timer_create(2)。
将itimerspec结构初始化为用户指定的频率值（以毫秒为单位）

然后：

向用户显示消息：

We shall start a timer anywhere between 1 and 5 seconds of starting this app.

GET READY ...
 [ when the "QUICK! Press ^C" message appears, press ^C quickly as you can ]

在 1 到 5 秒之间的任意时间，警报会过期
我们进入SIGALRM处理程序函数
显示*** 快！按^C 键！***消息
调用timer_settime(2)来设置计时器
获取tm_start时间戳（使用clock_gettime(2)API）
现在 POSIX 间隔计时器正在运行；它每freq_ms毫秒到期一次（由用户提供的值）；在详细模式下运行时，我们为每个计时器到期显示一个**.**。
用户在某个时候，近或远，做出反应并按下Ctrl+C（^C）；在 SIGINT 的信号处理程序代码中，我们执行以下操作：
获取tm_end时间戳（使用clock_gettime(2)API）
通过tm_end - tm_start计算增量（反应时间！），并显示它
退出。

反应 - 试验运行

最好是看到程序在运行中的情况；当然，读者最好（并且会更享受这个练习！）亲自构建并尝试一下：

$ ./react 
Usage: ./react <freq-in-millisec> [verbose-mode:[0]|1]
  default: verbosity is off
  f.e.: ./react 100   => timeout every 100 ms, verbosity Off
      : ./react   5 1 => timeout every   5 ms, verbosity On

How fast can you react!?
Once you run this app with the freq-in-millisec parameter,
we shall start a timer anywhere between 1 and 5 seconds of
your starting it. Watch the screen carefully; the moment
the message "QUICK! Press ^C" appears, press ^C (Ctrl+c simultaneously)!
Your reaction time is displayed... Have fun!

$

我们首先以 10 毫秒的频率运行它，而且不显示详细信息：

$ ./react 10
Initializing timer to generate SIGRTMIN every 10 ms
[Verbose: N]
We shall start a timer anytime between 1 and 5 seconds from now...

GET READY ...
 [ when the "QUICK! Press ^C" message appears, press ^C quickly as you can ]

在 1 到 5 秒的随机间隔之后，出现这条消息，用户必须做出反应：

*** QUICK! Press ^C !!! ***
^C
*** PRESSED ***
 Your reaction time is precisely 0.404794198 s.ns [~= 405 ms, count=40]
$

接下来，以 10 毫秒的频率和详细模式：

$ ./react 10 1
Initializing timer to generate SIGRTMIN every 10 ms
timer struct ::
 it_value.tv_sec = 0 it_value.tv_nsec = 10000000
 it_interval.tv_sec = 0 it_interval.tv_nsec = 10000000
[SigBlk: -none-]
[Verbose: Y]
We shall start a timer anytime between 1 and 5 seconds from now...

GET READY ...
 [ when the "QUICK! Press ^C" message appears, press ^C quickly as you can ]

在 1 到 5 秒的随机间隔之后，出现这条消息，用户必须做出反应：

react.c:arm_timer:161: Arming timer now

*** QUICK! Press ^C !!! *

现在，每次 POSIX 间隔计时器到期时，句号字符.会迅速出现，也就是说，在这次运行中，每 10 毫秒出现一次。

.....................................^C
*** PRESSED ***
 Your reaction time is precisely 0.379339662 s.ns [~= 379 ms, count=37]
$

在我们之前的样本运行中，用户反应需要 405 毫秒和 379 毫秒；正如我们提到的，它在数百毫秒的范围内。接受挑战——你能做得更好吗？

研究结果表明，人类平均反应时间如下：

刺激	视觉	听觉	触觉
平均人类反应时间	250 毫秒	170 毫秒	150 毫秒

来源：backyardbrains.com/experiments/reactiontime。我们已经习惯于使用短语，比如“眨眼之间”来表示非常快。有趣的是，眨眼实际上需要多长时间？研究表明，平均需要 300 到 400 毫秒！

反应游戏 - 代码视图

一些关键功能方面如下所示；首先是为SIGRTMIN设置信号处理程序并创建 POSIX 间隔的代码（ch13/react.c）：

为了可读性，以下仅显示源代码的关键部分；要查看完整的源代码，构建并运行它，整个树都可以从 GitHub 克隆，链接在这里：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux。

static int init(void)
{
 struct sigevent sev;
  struct rlimit rlim;
  struct sigaction act;

  // Trap SIGRTMIN : delivered on (interval) timer expiry
  memset(&act, 0, sizeof(act));
  act.sa_flags = SA_SIGINFO | SA_RESTART;
  act.sa_sigaction = timer_handler;
  if (sigaction(SIGRTMIN, &act, NULL) == -1)
    FATAL("sigaction SIGRTMIN failed\n");

[...]

/* Create and init the timer */
  sev.sigev_notify = SIGEV_SIGNAL;
  sev.sigev_signo = SIGRTMIN;
  sev.sigev_value.sival_ptr = &timerid;
  if (timer_create(CLOCK_REALTIME, &sev, &timerid) == -1)
    FATAL("timer_create failed\n");

  printf("Initializing timer to generate SIGRTMIN every %ld ms\n",
         freq_ms);
  memset(&itv, 0, sizeof(struct itimerspec));
  itv.it_value.tv_sec = (freq_ms * 1000000) / 1000000000;
  itv.it_value.tv_nsec = (freq_ms * 1000000) % 1000000000;
  itv.it_interval.tv_sec = (freq_ms * 1000000) / 1000000000;
  itv.it_interval.tv_nsec = (freq_ms * 1000000) % 1000000000;
[...]

意外开始的实现如下：

/* random_start
 * The element of surprise: fire off an 'alarm' - resulting in SIGALRM being
 * delivered to us - in a random number between [min..max] seconds.
 */
static void random_start(int min, int max)
{
    unsigned int nr;

    alarm(0);
    srandom(time(0));
    nr = (random() % max) + min;

#define CHEAT_MODE     0
#if (CHEAT_MODE == 1)
    printf("Ok Cheater :-) get ready; press ^C in %ds ...\n", nr);
#endif
 alarm(nr);
}

它的调用如下：

#define MIN_START_SEC 1
#define MAX_START_SEC 5
[...]
random_start(MIN_START_SEC, MAX_START_SEC);

信号处理程序（函数startoff）和与闹钟（SIGALRM）相关的逻辑如下：

static void arm_timer(timer_t tmrid, struct itimerspec *itmspec)
{
  VPRINT("Arming timer now\n");
  if (timer_settime(tmrid, 0, itmspec, NULL) == -1)
      FATAL("timer_settime failed\n");
  jumped_the_gun = 0;
}

/*
 * startoff
 * The signal handler for SIGALRM; arrival here implies the app has
 * "started" - we shall arm the interval timer here, it will start
 * running immediately. Take a timestamp now.
 */
static void startoff(int sig)
{
  char press_msg[] = "\n*** QUICK! Press ^C !!! ***\n";

  arm_timer(timerid, &itv);
  write(STDERR_FILENO, press_msg, strlen(press_msg));

  //—- timestamp it: start time
  if (clock_gettime(CLOCK_REALTIME, &tm_start) < 0)
      FATAL("clock_gettime (tm_start) failed\n");
}

请记住，当用户在四处游荡时，我们的 POSIX 间隔计时器会继续以用户指定的频率设置和重置自身（作为传递的第一个参数，我们将其保存在变量freq_ms中）；因此，每freq_ms毫秒，我们的进程将接收到信号SIGRTMIN。这是它的信号处理程序例程：

static volatile sig_atomic_t gTimerRepeats = 0, c = 0, first_time = 1,
    jumped_the_gun = 1; [...] static void timer_handler(int sig, siginfo_t * si, void *uc)
{
  char buf[] = ".";

  c++;
  if (verbose) {
      write(2, buf, 1);
#define SHOW_OVERRUN 1
#if (SHOW_OVERRUN == 1)
      {
          int ovrun = timer_getoverrun(timerid);
          if (ovrun == -1)
              WARN("timer_getoverrun");
          else {
              if (ovrun)
                  printf(" overrun=%d [@count=%d]\n", ovrun, c);
          }
    }
#endif
  }
}

当用户（最终！）按下*^C*时，将调用 SIGINT 的信号处理程序（函数userpress）：

static void userpress(int sig)
{
  struct timespec res;

  // timestamp it: end time
  if (clock_gettime(CLOCK_REALTIME, &tm_end) < 0)
    FATAL("clock_gettime (tm_end) failed\n");

  [...]
      printf("\n*** PRESSED ***\n");
      /* Calculate the delta; subtracting one struct timespec
       * from another takes a little work. A retrofit ver of
       * the 'timerspecsub' macro has been incorporated into
       * our ../common.h header to do this.
       */
      timerspecsub(&tm_end, &tm_start, &res);
      printf
          (" Your reaction time is precisely %ld.%ld s.ns"
           " [~= %3.0f ms, count=%d]\n",
           res.tv_sec, res.tv_nsec,
           res.tv_sec * 1000 +
             round((double)res.tv_nsec / 1000000), c);
    }
   [...]
  c = 0;
  if (!gTimerRepeats)
    exit(EXIT_SUCCESS);
}

运行：步行间隔计时器应用程序

本书的作者是一个自称业余跑步者。在我看来，跑步者/慢跑者，尤其是刚开始时（甚至经验丰富的人），可以从一致的跑步：步行模式中受益（单位通常是分钟）。

这背后的想法是，持续奔跑很难，尤其是对初学者来说。教练经常让新手跑步者遵循有用的跑步：步行策略；跑一段时间，然后休息一段时间，然后重复——再跑，再走——无限期地，或者直到达到目标距离（或时间）。

例如，当初学者跑 5 公里或 10 公里时，可能会遵循一致的 5:2 跑步：步行模式；也就是说，跑步 5 分钟，步行 2 分钟，重复这个过程，直到跑步结束。（而超级长跑者可能更喜欢类似 25:5 的策略。）

为什么不编写一个跑步：步行计时器应用程序，以帮助我们的初学者和认真的跑步者。

我们将这样做。不过，从更好地理解这个程序的角度来看，让我们想象一下程序已经编写并且正在运行——我们将试一试。

几次试运行

当我们简单地运行程序而不传递任何参数时，帮助屏幕会显示出来：

$ ./runwalk_timer 
Usage: ./runwalk_timer Run-for[sec] Walk-for[sec] [verbosity-level=0|[1]|2]
 Verbosity Level :: 0 = OFF [1 = LOW] 2 = HIGH
$

正如所见，程序期望至少有两个参数：

跑步时间（以秒为单位）[必需]
步行时间（以秒为单位）[必需]
冗长级别[可选]

可选的第三个参数，冗长级别，允许用户在程序执行时请求更多或更少的信息（这总是一种有用的工具，因此有助于调试程序）。我们提供了三种可能的冗长级别：

OFF：除了必需的内容之外，不显示任何内容（传递第三个参数 0）
LOW：与关闭级别相同，另外我们使用句点字符**.**来显示时间流逝——每秒钟，**.**都会打印到stdout[默认]
HIGH：与关闭级别相同，另外我们显示内部数据结构值、计时器到期时间等（传递第三个参数 2）

让我们首先尝试以默认的冗长级别（LOW）运行，使用以下规范：

运行 5 秒
步行 2 秒

好吧，好吧，我们知道，你比那更健康——你可以跑步：步行超过 5 秒：2 秒。原谅我们，但是这样的事情：为了演示的目的，我们并不真的想等到 5 分钟然后再过 2 分钟，只是为了看看它是否有效，对吧？（当您在跑步时使用这个应用程序时，请将分钟转换为秒并尝试！）。

话不多说；让我们启动一个 5:2 的跑步：步行 POSIX 计时器：

$ ./runwalk_timer 5 2
************* Run Walk Timer *************
                  Ver 1.0

Get moving... Run for 5 seconds
.....        *<< each "." represents 1 second of elapsed time >>*
*** Bzzzz!!! WALK! *** for 2 seconds
..
*** Bzzzz!!! RUN! *** for 5 seconds
.....
*** Bzzzz!!! WALK! *** for 2 seconds
..
*** Bzzzz!!! RUN! *** for 5 seconds
....^C
+++ Good job, bye! +++
$

是的，它有效；我们通过输入*^C*（Ctrl+C）来中断它。

前面的试运行是在默认的冗长级别LOW；现在让我们以相同的 5:2 跑步：步行间隔重新运行它，但是将冗长级别设置为HIGH，通过传递2作为第三个参数：

$ ./runwalk_timer 5 2 2
************* Run Walk Timer *************
                  Ver 1.0

Get moving... Run for 5 seconds
trun= 5 twalk= 2; app ctx ptr = 0x7ffce9c55270
runwalk: 4.999s                    *<< query on time remaining >>*
runwalk: 3.999s
runwalk: 2.999s
runwalk: 1.999s
runwalk: 0.999s
its_time: signal 34. runwalk ptr: 0x7ffce9c55270 Type: Run. Overrun: 0

*** Bzzzz!!! WALK! *** for 2 seconds
runwalk: 1.999s
runwalk: 0.999s
its_time: signal 34. runwalk ptr: 0x7ffce9c55270 Type: Walk. Overrun: 0

*** Bzzzz!!! RUN! *** for 5 seconds
runwalk: 4.999s
runwalk: 3.999s
runwalk: 2.999s
runwalk: 1.999s
runwalk: 0.999s
its_time: signal 34. runwalk ptr: 0x7ffce9c55270 Type: Run. Overrun: 0

*** Bzzzz!!! WALK! *** for 2 seconds
runwalk: 1.999s
runwalk: 0.999s
its_time: signal 34. runwalk ptr: 0x7ffce9c55270 Type: Walk. Overrun: 0

*** Bzzzz!!! RUN! *** for 5 seconds
runwalk: 4.999s
runwalk: 3.999s
runwalk: 2.999s
^C
+++ Good job, bye! +++
$

细节被揭示；每秒钟，我们的 POSIX 计时器到期的剩余时间被显示出来（以毫秒为分辨率）。当计时器到期时，操作系统向进程发送实时信号SIGRTMIN；我们进入信号处理程序its_time，然后我们打印出从struct siginfo_t指针获得的信号信息。我们接收到信号号码（34）和联合体si->si_value中的指针，这是指向我们的应用程序上下文数据结构的指针，因此我们可以在没有使用全局变量的情况下访问它（稍后会详细介绍）。（当然，正如多次注意到的那样，在信号处理程序中使用printf(3)和变体是不安全的。我们在这里只是为了演示；不要在生产中这样编码。Bzzzz!!!消息代表计时器响起的声音，当然；程序指示用户相应地进行RUN!或WALK!，以及进行的秒数。整个过程无限重复。

低级设计和代码

这个简单的程序将允许您设置跑步和步行的秒数。它将相应地计时。

在这个应用程序中，我们使用一个简单的一次性 POSIX 计时器来完成工作。我们设置计时器使用信号通知作为计时器到期通知机制。我们为 RT 信号（SIGRTMIN）设置了一个信号处理程序。接下来，我们最初将 POSIX 计时器设置为在跑步期间到期，然后当信号在信号处理程序中到达时，我们重新设置（重新装载）计时器，使其在步行期间秒后到期。这基本上是无限重复的，或者直到用户通过按*^C*中止程序。

为了可读性，以下仅显示源代码的关键部分；要查看完整的源代码，构建并运行它，整个树可在 GitHub 上克隆：github.com/PacktPublishing/Hands-on-System-Programming-with-Linux。

许多现实世界的应用程序（实际上，任何软件）通常需要几个信息片段 - 在任何给定时间点都可用于所有函数 - 即全局可用。通常，可以将它们声明为全局（静态）变量并继续。我们有一个建议：为什么不将它们全部封装到一个单一的数据结构中？事实上，为什么不通过 typedef 一个结构来使其成为我们自己的？然后我们可以为其分配内存，初始化它，并以一种不需要它成为全局的方式传递其指针。那将是高效而优雅的。

// Our app context data structure
typedef struct {
  int trun, twalk;
  int type;
  struct itimerspec *itmrspec;
  timer_t timerid;
} sRunWalk;

在我们的应用程序中，为了保持简单，我们只是静态分配内存给（此外，请注意它是一个局部变量，而不是全局变量）：

int main(int argc, char **argv)
{
  struct sigaction act;
  sRunWalk runwalk;
  struct itimerspec runwalk_curval;
[...]

初始化工作在这里进行：

/*————————— Our POSIX Timer setup
 * Setup a 'one-shot' POSIX Timer; initially set it to expire upon
 * 'run time' seconds elapsing.
 */
static void runwalk_timer_init_and_arm(sRunWalk * ps)
{
  struct sigaction act;
  struct sigevent runwalk_evp;

  assert(ps);

  act.sa_sigaction = its_time;
  act.sa_flags = SA_SIGINFO;
  sigfillset(&act.sa_mask);
  if (sigaction(SIGRTMIN, &act, 0) < 0)
      FATAL("sigaction: SIGRTMIN");
  memset(ps->itmrspec, 0, sizeof(sRunWalk));
  ps->type = RUN;
 ps->itmrspec->it_value.tv_sec = ps->trun;

  runwalk_evp.sigev_notify = SIGEV_SIGNAL;
  runwalk_evp.sigev_signo = SIGRTMIN;
  // Pass along the app context structure pointer
 runwalk_evp.sigev_value.sival_ptr = ps;

  // Create the runwalk 'one-shot' timer
  if (timer_create(CLOCK_REALTIME, &runwalk_evp, &ps->timerid) < 0)
      FATAL("timer_create");

  // Arm timer; will exire in ps->trun seconds, triggering the RT signal
  if (timer_settime(ps->timerid, 0, ps->itmrspec, NULL) < 0)
      FATAL("timer_settime failed");
}
[...]
runwalk_timer_init_and_arm(&runwalk);
[...]

在上述代码中，我们执行以下操作：

捕获实时信号（SIGRTMIN）（在定时器到期时传递）。
初始化我们的应用上下文运行：步行数据结构：
特别是，将类型设置为运行，并将超时值（秒）设置为用户传递的第一个参数中的时间。
定时器到期事件通知机制被选择为通过sigevent结构的sigev_notify成员进行信号传递。
通过sigev_value.sival_ptr成员将传递的数据设置为指向我们应用上下文的指针是有用的；这样，我们可以在信号处理程序中始终访问它（消除了保持全局的需要）。
使用实时时钟源创建 POSIX 定时器，并将其 ID 设置为我们应用上下文运行步行结构的timerid成员
装载 - 或启动 - 定时器。（回想一下，它已经初始化为在运行秒后到期。）

在我们之前的试运行中，运行设置为 5 秒，因此，从开始的 5 秒开始，我们将异步进入SIGRTMIN的信号处理程序its_time，如下所示：

static void its_time(int signum, siginfo_t *si, void *uctx)
{
  // Gain access to our app context
 volatile sRunWalk *ps = (sRunWalk *)si->si_value.sival_ptr;

  assert(ps);
  if (verbose == HIGH)
    printf("%s: signal %d. runwalk ptr: %p"
           " Type: %s. Overrun: %d\n",
           __func__, signum,
           ps,
           ps->type == WALK ? "Walk" : "Run", 
           timer_getoverrun(ps->timerid)
        );

  memset(ps->itmrspec, 0, sizeof(sRunWalk));
  if (ps->type == WALK) {
    BUZZ(" RUN!");
    ps->itmrspec->it_value.tv_sec = ps->trun;
    printf(" for %4d seconds\n", ps->trun);
  }
  else {
    BUZZ(" WALK!");
    ps->itmrspec->it_value.tv_sec = ps->twalk;
    printf(" for %4d seconds\n", ps->twalk);
  }
  ps->type = !ps->type; // toggle the type

  // Reset: re-arm the one-shot timer
  if (timer_settime(ps->timerid, 0, ps->itmrspec, NULL) < 0)
    FATAL("timer_settime failed");
}

在信号处理代码中，我们执行以下操作：

（如前所述）访问我们的应用上下文数据结构（通过将si->si_value.sival_ptr强制转换为我们的（sRunWalk *）数据类型）。
在高度冗长的模式下，我们显示更多细节（再次，不要在生产中使用printf(3)）。
然后，如果刚刚到期的定时器是RUN，我们调用我们的蜂鸣器函数BUZZ并传递WALK消息参数，而且，重要的是：
重新初始化超时值（秒）为用户传递的第二个参数的持续时间。
将类型从运行切换到步行。
通过timer_settime(2)API 重新装载定时器。
在从刚刚到期的步行模式转换到运行模式时也是如此。

这样，进程将永远运行（或直到用户通过*^C*终止它），不断地在下一个运行：步行间隔超时。

通过 proc 查找定时器

还有一件事：有趣的是，Linux 内核允许我们深入了解操作系统；这通常是通过强大的 Linux proc 文件系统实现的。在我们当前的上下文中，proc 允许我们查找给定进程的所有定时器。这是如何做到的？通过读取伪文件/proc/<PID>/timers。看一看。下面的屏幕截图说明了这是如何在runwalk_timer进程上执行的。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

左侧的终端窗口是runwalk_timer应用程序运行的地方；当它正在运行时，在右侧的终端窗口中，我们查找 proc 文件系统的伪文件/proc/<PID>/timers。输出清楚地显示了以下内容：

进程中只有一个（POSIX）定时器（ID 为0）。
定时器到期事件通知机制是信号，因为我们可以看到notify:signal/pid.<PID>和 signal: 34 与该定时器相关联（signal: 34 是SIGRTMIN；使用kill -l 34来验证）。
与此定时器相关的时钟源是 ClockID 0；也就是实时时钟。

快速提及

为了结束本章，我们简要介绍了两种有趣的技术：通过文件抽象模型和看门狗定时器。这些部分没有详细介绍；我们留给感兴趣的读者进一步了解。

通过文件描述符使用定时器

您是否还记得我们在本书的第一章中介绍的 Unix（因此也是 Linux）设计的一个关键理念？也就是说，一切都是一个进程；如果不是进程，就是一个文件。文件抽象在 Linux 上被广泛使用；在这里，我们也发现可以通过文件抽象来表示和使用定时器。

这是如何实现的？timerfd_* API 提供了所需的抽象。在本书中，我们不打算深入研究复杂的细节；相反，我们希望读者意识到，如果需要，可以使用文件抽象—通过read(2)系统调用读取定时器。

以下表格快速概述了timerfd_* API 集：

API	目的	等同于 POSIX 定时器 API
`timerfd_create(2)`	创建一个 POSIX 定时器；成功时返回值是与该定时器关联的文件描述符。	`timer_create(2)`
`timerfd_settime(2)`	(解)装备由第一个参数`fd`引用的定时器。	`timer_settime(2)`
`timerfd_gettime(2)` 在成功完成时，返回由第一个参数 `fd` 引用的定时器的到期时间和间隔。`timer_gettime(2)`

表 4：timerfd_* API

include <sys/timerfd.h>

int timerfd_create(int clockid, int flags);

int timerfd_settime(int fd, int flags,
 const struct itimerspec *new_value, struct itimerspec *old_value);

int timerfd_gettime(int fd, struct itimerspec *curr_value);

使用文件描述符表示各种对象的真正优势在于可以使用统一、强大的一组 API 对它们进行操作。在这种特殊情况下，我们可以通过read(2)、poll(2)、select(2)、epoll(7)和类似的 API 来监视基于文件的定时器。

如果创建了基于 fd 的定时器的进程进行了 fork 或 exec 怎么办？在fork(2)时，子进程将继承父进程通过timerfd_create(2)API 创建的任何定时器相关的文件描述符的副本。实际上，它与父进程共享相同的定时器。

在execve(2)时，定时器在继承的进程中仍然有效，并且将在超时时继续到期；除非在创建时指定了TFD_CLOEXEC标志。

更多详细信息（以及示例）可以在此处的 man 页面中找到：linux.die.net/man/2/timerfd_create。

关于看门狗定时器的简要说明

看门狗本质上是一种基于定时器的机制，用于定期检测系统是否处于健康状态，如果被认为不是，就重新启动它。

这是通过设置（内核）定时器（比如，60 秒超时）来实现的。如果一切正常，看门狗守护进程将在定时器到期之前一直解除定时器，并随后重新启用（装备）它；这被称为抚摸狗。如果守护进程不解除看门狗定时器（因为某些事情出了问题），看门狗会感到恼火并重新启动系统。

守护进程是系统后台进程；有关守护进程的更多信息，请参阅附录 B，守护进程。

纯软件看门狗实现将无法防止内核错误和故障；硬件看门狗（它连接到板复位电路）将始终能够在需要时重新启动系统。

看门狗定时器在嵌入式系统中经常被使用，特别是在深度嵌入式系统中（或者由于某种原因无法被人类接触到的系统）；在最坏的情况下，它可以重新启动，并希望再次执行其指定的任务。一个著名的看门狗定时器导致重启的例子是 NASA 在 1997 年发送到火星表面的 Pathfinder 机器人（是的，就是在火星上遇到了优先级倒置并发错误的那个机器人。我们将在第十五章《使用 Pthreads 进行多线程编程第二部分-同步》中稍微探讨一下这个问题，关于多线程和并发）。是的，这就是在优秀电影《火星救援》中扮演角色的 Pathfinder 机器人！关于这个问题，我们将在 GitHub 存储库的“进一步阅读”部分中详细介绍。

总结

在本章中，读者已经了解了 Linux 在创建和使用定时器方面提供的各种接口。设置和管理超时是许多系统应用的重要组成部分，如果不是大多数系统应用的话。旧的接口——备受尊敬的alarm(2)API，以及[s|g]etitimer(2)系统调用——都有示例代码。然后，我们深入了解了更新更好的 POSIX 定时器，包括它们提供的优势以及如何在实际中使用它们。这在两个相当复杂的示例程序——react 游戏和 run:walk 定时器应用程序的帮助下得到了很大的帮助。最后，读者被介绍了通过文件抽象使用定时器的概念，以及看门狗定时器。

下一章将是我们开始在 Linux 上理解和使用强大的多线程框架的漫长三章旅程的地方。