异常控制流——（中断、陷阱、故障、终止、进程等操作系统干货）

本文链接：https://blog.csdn.net/yueliangmua/article/details/134508555

异常

异常控制流

控制流：

假设从处理机上电运行一直到断电关机的这段时间内，程序计数器的值是下图序列，其中a_k表示某一条指令I_k的地址。

**控制转移：**每一次从a_k到a_k+1的过渡

**平滑：**I_k和I_k+1在内存中是相邻的，若平滑发生了突变，通常是由于跳转、函数调用和返回这类指令造成

**最简单的控制流：**一个平滑的序列

假设从网络中传输的数据包到达网络适配器之后，需要将数据放到内存中，此时发生的突变就称为异常控制流。

异常控制流是操作系统用来实现I/O、进程、并发以及虚拟内存的基本机制。

系统为每种类型的异常都分配了唯一的异常编号，其中一些号码是由处理器的设计者分配的（例如被0除、缺页以及算术运算等），其他号码是由操作系统内核的设计者分配的（例如系统调用以及来自外部I/O设备的信号）

**异常表：**系统启动时，操作系统分配和初始化的一个跳转表，异常号为跳转表的索引号，发生异常时根据该表找到对应的异常处理程序，异常表的起始地址保存在CPU的一个特殊寄存器中，通过异常表基址寄存器和异常号可以确定异常表项，异常表项中的对应异常处理程序的起始地址。

异常处理：

返回当前指令或下一条指令
处理器的状态压入栈中
控制从用户态转向内核态，那么所有内容都压入内核栈中，而不是用户栈中
异常处理程序运行在内核态，所以对所有系统资源都有访问权限

异常

异常分为中断、陷阱、故障和终止，中断是异步的（即异常来自CPU外部），另外三个是同步的（异常来自CPU内部）。

中断

处理过程：

假设I/O设备为键盘，敲一下键盘时，键盘控制器会向处理器的中断引脚发送信号来触发中断，同时会将异常号（标识引起中断的设备）放到系统总线上；CPU执行完当前指令后发现中断引脚电压变高，于是从系统总线上读取异常号，判断是哪个设备发生中断，然后调用对应中断处理程序，中断处理完毕后，CPU返回继续执行下一条指令（没发生中断前的下一条）

陷阱

用途：为用户程序和操作系统内核之间提供一个类似函数的接口，即系统调用。

处理过程：当应用程序需要读取文件或者创建新的进程时，此时需要向内核请求服务，处理器为其提供了一条特殊指令——syscall，执行syscall导致一个陷阱，接下来陷阱处理程序解析参数，并调用适当的内核程序提供系统级的服务，陷阱处理程序执行完毕后，返回到指令syscall之后的指令继续执行。

故障

故障是由错误情况引起的，有可能被故障处理程序修复

处理过程：当前指令若导致故障发生，处理器会将控制转移给故障处理程序，故障处理程序如果能修复这个故障情况，那么就将控制返回给引起故障的指令，然后重新执行该条指令，否则终止引起故障的应用程序（经典案例：缺页异常）。

终止

终止是由不可恢复的致命错误导致的，通常是一些硬件错误，例如DRAM或者SRAM存储为被损坏时，会导致奇偶校验出错，对于这类硬件错误，终止处理程序从不将控制返回给应用程序，而是直接终止这个应用程序。

x86系统中共定义了256种异常，编号0~31是intel架构师定义的，32~255是由操作系统定义

异常号	描述	异常类型
0	除0异常	故障
13	引用了未定义的虚拟内存区域或程序尝试去写只读文本段（段错误）	故障
14	缺页异常	故障
18	机器检查（硬件发生错误）	终止
32-255	操作系统定义的异常	中断或陷阱

进程与上下文

进程：进程就是一个正在执行的程序实例。

运行程序时的两个假象：

程序独占的使用处理器
程序独占的使用内存系统

**逻辑控制流：**假如用调试器控制程序单步执行，我们会看到一系列程序计数器（PC）的数值，这些数值与可执行程序中的指令是一一对应的，把这个PC值的序列成为逻辑控制流，如下图，竖线表示逻辑控制流，这张图描述了不同进程之间轮流使用处理器的情况，每个进程执行逻辑流的一部分，而时间上有重叠的的流称为并发流，进程之间也称为并发流。

地址空间地址分布：

低地址部分是预留给应用程序的，包括代码段、数据段、堆和栈，代码段总是从0x400000处开始，地址的高地址部分是留给操作系统内核的，属于用户代码不可见的内存区域

储存其映像

tips：在Linux环境下使用有一个proc文件记录了内核相关数据结构，通过这个文件，用户模式下也能访问内核数据结构的内容

模式

通常处理器通过控制寄存器的模式位来实现用户模式和内核模式的切换

内核模式可以执行特权指令，特权指令可以停止处理器、改变模式位以及发起一个IO操作等

用户模式通过中断、陷阱（系统调用）、故障切换到内核模式，执行完异常处理程序后回到用户模式

上下文context

内核为每一个进程维持了一个上下文，上下文就是内容重新启动一个被抢占进程所需的状态，由**通用目的寄存器、浮点寄存器、程序寄存器、用户栈、状态寄存器、内核栈和各种内核数据结构（包括描述地址空间的页表、包含有关当前进程信息的进程表以及包含进程已打开文件的信息表）**的值组成。

上下文切换：

进程调度使用上下文切换机制。

分为三步：

保存当前进程的上下文
恢复某个先前被抢占进程的上下文
将控制传递给这个新恢复的进程

创建进程

fork函数

调用一次，返回两次，一次返回给父进程另一次返回给新创建的子进程。

int main()
{
    pid_t pid;
    int x = 1;
    pid = Fork();
    if(pid == 0){
		printf("child: x=%d\n", ++x);
        exit(0);
    }
    printf("parent: x=%d\n", --x);
    exit(0);
}

父进程中，fork的返回值是子进程的PID；子进程中，fork的返回值是0，由于子进程的进程号总是大于0，所以可以通过进程号不同来区分当前在哪个进程执行。

运行结果：

parent： x=0
child： 	x=2

父进程与子进程的地址空间内容是相同的，且共享文件，但他们都有自己的私有地址空间

execve函数

int execve(const char *filename, const char *argv[], const char *envp[]);

调用之后不会返回。

参数：

第一个参数：表示可执行程序的文件名

第二个参数：表示可执行程序需要输入的参数列表

第三个参数：表示环境变量列表

运行下列程序，可以查看系统环境变量

#include<stdio.h>
int main(int argc, char *argv[], char *envp[]){
	printf("环境变量:\n");
	int i;
	for(i = 0; envp[i] != 0; i++){
		printf("envp[%2d]: %s\n", i, envp[i]);
	}
	return 0;
}

作用：

调用加载器，在执行可执行程序的main函数之前，启动代码需要设置用户栈，并将控制传递给新程序的主函数

僵死进程（zombie）

当一个进程由于某种原因终止时，内核并不是立即把它从系统中清楚，此时进程被保持在一种已终止的状态中，直到被它的父进程回收，我们把一个终止运行但未被回收的进程成为僵死进程。

僵死进程虽然没有在运行，但是仍然在消耗系统的内存资源。

waitpid函数

父进程等待子进程终止或停止

#include<sys/type.h>
#include<sys/wait.h>
pid_t waitpid(pid_t pid, int *statusp, int options);

第一个参数：

① pid > 0

表示等待的进程是一个单独的子进程，子进程ID就是pid的值。

②pid = -1

表示等待的进程是由父进程创建的所有子进程组成的集合

第二个参数：

statusp是非空的，函数waitpid会在statusp中放上导致返回的子进程的状态信息

statusp指向的参数status对应的几个宏

WIFEXITED(status)

子进程是通过函数exit或者return正常终止，那么该宏结果就是True

WIFSIGNALED(status)

子进程是通过一个未捕获的信号终止的，那么该宏结果就是True

WEXITSTATUS(status)

返回一个正常终止的子进程的退出状态。只有在WIFEXITED()返回为真时，才会定义这个状态。

WTERMSIG(status)

返回导致子进程终止的信号的编号。只有在WIFSIGNALED()返回为真时，才定义这个状态。

WIFSTOPPED(status)

如果引起返回的子进程当前是停止的，那么就返回真。

WSTOPSIG(status)

返回引起子进程停止的信号的编号。只有在WIFSTOPPED()返回为真时，才定义这个状态。

WIFCONTINUED(status)

如果子进程收到SIGCONT信号重新启动，那么就返回为真。

信号

信号允许内核和进程中断其他进程，信号提供了一种机制，用来通知进程发生了哪些异常情况。

关于信号类型，看书！！！

示例：

例如当一个进程试图执行除以0的操作时，那么内核会给该进程发送一个SIGFPG的信号，这个信号对应的是浮点异常的事件。

例如当一个进程执行了一条非法指令，那么内核会给该进程发送一个SIGILL的信号，该信号对应的事件是非法指令。

例如当一个进程在Linux Shell中执行，此时按下Ctrl+C键，那么内核就会发送一个中断信号给当前进程，终止它的运行。

进程组：

每个进程都只属于一个进程组，每个进程组有自己唯一的ID值来唯一标识，ID为一个正整数。

可以使用getpgrp函数来获取当前进程所属的进程组ID。

#include<unistd.h>
pid_t getpgrp(void);

默认情况下，一个子进程和它的父进程属于一个进程组，不过进程可以通过下图这个函数改变自己或者其他进程的进程组。

#include<unistd.h>
pid_t setpgrp(pid_t pid, pid_t pgid);

如果pid值为0，那么使用当前进程的PID值，如果pgid值为0，那么就是用pid指定的进程PID作为进程组的ID值。

发送信号

几种信号传送机制

第一种：

通过/bin目录中的kill程序可以向其他进程发送任意信号，如下图。

linuc> /bin/kill -9 15213

信号9表示杀死进程，这条命令执行完后，15213进程终止运行。

linuc> /bin/kill -9 -15213

这条命令执行完后，15213进程组的每一条进程都终止运行。

第二种：

当键盘输入Ctrl+C，默认终止前台作业，输入Ctrl+Z，会挂起前台作业。

第三种：

#include<sys/types.h>
#include<signal.h>
int kill(pid_t pid, int sig);

如果pid值大于0，那么函数kill发送信号sig给进程pid

如果pid等于0，那么函数kill发送信号给当前进程所在进程组的所有进程

如果pid小于0，那么函数kill发送信号给进程组pid中的每个进程

第四种：

#include<unistd.h>
unsigned int alarm(unsigned int secs);

参数secs表示函数alarm安排内核在secs秒后发送一个SIGALARM信号给当前进程，如果secs为0，就不会调用新的闹钟了。

接收信号

当内核把进程p从内核模式切换到用户模式时，此时会检查进程p未阻塞状态的待处理的信号集合，如果这个集合为空，那么内核将控制传递到进程p的逻辑控制流的下一条指令，如果集合时非空，那么内核选择集合中的一个信号k，强制进程p接受信号k，接受信号会触发控制转移到信号处理程序，在信号处理程序完成处理之后，它将控制返回给被中断的程序。

每个信号都有一个预定义的默认行为：

第一种行为是进程终止，例如收到信号SIGKILL后，接收进程终止运行。

第二种行为是进程终止并转储内存，转存内存的意思是把代码和数据的内存镜像写到磁盘上

第三种行为是进程挂起，进程挂起直到被SIGCONT信号重启

第四种行为是可以直接忽略的信号，例如SIGCHLD信号

一个发出但未被接收的信号叫做待处理信号，一种类型只有一个待处理信号，例如进程有一个类型为k的待处理信号，那么任何接下来发送到该进程类型为k的信号都会被丢弃。

信号处理程序可以被其他信号处理程序中断。

非本地跳转

C提供了一个用户级异常控制流形式，称为非本地跳转，将控制直接从一个函数转移到另一个正在执行的函数，而不需要经过正常的调用返回序列。其实现形如

#include <setjmp.h>
int setjmp(jum_buf env);

其中，在第一次调用时，setjmp()返回0，且不能赋值给变量。setjmp()在env缓冲区保存当前的调用环境，并使用longjmp函数从env缓冲区中恢复调用环境，然后触发一个从最近一次初始化env的setjmp调用的返回，形如

#include <setjmp.h>
int longjmp(jum_buf env, int retval);

非本地跳转的一个重要应用是允许从一个深层嵌套的函数调用中立即返回，例如发现错误情况，就可以直接返回到一个普通的本地化的错误处理程序，而不是费力的反复返回来解开调用栈。
示例代码：

#include "csapp.h"
jmp_buf buf;
int error1 = 0;
int error2 = 1;
void foo(void);
void var(void);
int main(){
	swtich(setjmp(buf)){
	case 0:
		foo();
		break;
	case 1:
		printf("Detect an error1 condition in foo\n");
		break;
	case 2:
		printf("Detect an error2 condition in foo\n");
		break;
	default:
		printf("Unknown error condition in foo\n");
	}
	exit(0);
}

void foo(void){
    if (error1)
            longjmp(buf, 1);
        bar();
    }

    void bar(void){
        if (error2)
            longjmp(buf, 2);
    }
	exit(0);
}

其在进入main()后的开关语句中，setjmp()保存了环境，并返回了0，执行情况0，即调用foo()，foo()在正确的情况下调用bar()，完成调用，执行exit(0)关闭进程。如果调用foo()的过程中出现error1，则会跳转到开关语句，setjmp()返回1，执行情况1，报告error1的错误；如果调用bar()的过程出现error2，则会跳转到开关语句，setjmp()返回2，执行情况2，报告error2的错误。

;
}
exit(0);
}

void foo(void){
if (error1)
longjmp(buf, 1);
bar();
}

void bar(void){
    if (error2)
        longjmp(buf, 2);
}
exit(0);

}



其在进入main()后的开关语句中，setjmp()保存了环境，并返回了0，执行情况0，即调用foo()，foo()在正确的情况下调用bar()，完成调用，执行exit(0)关闭进程。如果调用foo()的过程中出现error1，则会跳转到开关语句，setjmp()返回1，执行情况1，报告error1的错误；如果调用bar()的过程出现error2，则会跳转到开关语句，setjmp()返回2，执行情况2，报告error2的错误。

  非本地跳转的另一个重要应用是使信号处理程序分支到一个特殊的代码位置，而不返回到被信号到达中断了的指令的位置。例如程序通过信号和非本地跳转重新定义中断的动作，使得进程不立即终止，而是回到主程序的入口，实现软重启。