1.什么是异常控制流
举个例子:假设有A1,A2两个值,其内存位置相邻,并且分别存放着指令I1、指令I2的地址,当计算机读取A1到读取A2的这个过渡,称之为“控制转移”,这样的 控制转移序列 叫做处理器的 控制流。
换句话说:
从给处理器加电,到断电为止,处理器做的工作其实就是不断地读取并执行一条条指令。这些指令的序列就叫做 CPU 的控制流(control flow)
- 当A1和A2的内存地址相邻的时候,且A1和A2存放的指令在执行顺序上也相邻的时候,那么就称这样的控制流为“平滑控制流”。
- 如果A1和A2的内存地址不相邻时,这样的控制流称为“异常控制流”。
一句话:异常控制流就是执行指令的顺序相邻但是存放指令的内存不相邻的控制流。
异常控制流 ECF 发生在计算机系统的各个层次:
- 硬件层,硬件中断
- 操作系统层,内核通过上下文切换将控制从一个进程转移到另一个进程
- 应用层,一个进程给另一个进程发送信号,信号接收者将控制转移到信号处理程序。
2.异常
异常是异常控制流的一种表现形式。
异常的剖析:
可以理解成系统在执行指令的时候从应用程序到异常处理程序的突发的控制转移(异常)。在异常处理程序完成处理后,它将控制返回给被中断的应用程序或者终止应用程序。
那么,系统是如何知道是返回中断的应用程序继续运行(上下文切换)呢?还是终止应用程序呢?
其实,有个名为“异常表”的跳转表,在程序调用之后,通过相关的“编号”一一对应后,到一个专门设计用来处理这类事件的操作系统子程序(异常处理程序exception handler),当异常处理完成处理后,根据引起异常的事件类型,会发生以下3种情况中的一种:
- 处理程序将控制返还给当前指令Icurr,即当事件发生时正在执行的指令;
- 处理程序将控制返还给Inext,如果没有发生异常将会执行下一条指令;
- 处理程序终止被中断的程序
异常处理程序都运行在内核态下
异常分为四种:
(1)中断
- 原因:I/O设备(例如网络适配器、磁盘控制器和定时器芯片)的信号处理
- 类型:异步
大概过程:外部I/O设备向处理器芯片的一个引脚发个信号,并将异常号放到系统总线上(异常号标识了引起中断的设备),以此来触发中断。在当前指令完成执行后,处理器注意到中断引脚的电压变高了,就从系统总线读取异常号,调用对应的中断处理程序。
剩下的异常类型(陷阱、故障和终止)是同步发生的,是由执行当前指令引起来的,这类引起异常的指令叫做故障指令。
(2)陷阱
- 原因:有意的异常,是执行一条指令的结果
- 类型:同步
一般用户程序是无法操作内核态的(后面会具体讲解用户态和内核态),但是用户程序经常需要向内核态请求服务,比如读一个文件(read)、创建一个新的进程(fork),加载一个新的程序(execve),或者终止当前进程(exit)。为了允许对这些内核服务的受控的访问,处理器提供了一条特殊的 “syscall n” 指令,当用户程序想要请求服务 n 时,可以执行这条指令。执行 syscall 指令会导致一个到异常处理程序的陷阱,这个处理程序解析参数,并调用适当的内核程序。
(3)故障
- 原因:执行一条指令遇到的某个错误
- 类型:同步
错误发生后, 处理器会停下当前指令的执行, 调用对应的 故障处理程序。如果 故障处理程序 能够修复这个错误, 那么控制流就返回到停下的指令 I_curr
处。 反之, 终止当前程序。
(4)终止
- 原因:不可恢复的致命错误造成的异常(硬件问题), 发生时会直接终止程序
- 类型:同步
3.进程
逻辑控制流:
并发控制流:
一个逻辑流的执行在时间上与另一个流重叠,称为并发流,这两个流被称为并发运行。如上图进程AC、进程AB。
并发与并行的区别:
并发是指一个处理器同时处理多个任务。 并行是指多个处理器或者是多核的处理器同时处理多个不同的任务。
私有地址空间:
地址空间概念:
地址空间就是对内存进行组织和管理的一种方式。 地址空间通常是一个连续的内存空间,由一个或多个进程使用。
私有地址空间:
私有地址空间,是通过虚拟内存(virtual memory)的机制,提供一个假象——好像程序独占存储器。
4.用户态与内核态
- 简单来说内核态就是操作系统运行线程,用户态就是线程执行用户自己的应用程序。
- 防止用户指令造成系统错乱
具体可参考:「操作系统」什么是用户态和内核态?为什么要区分-CSDN博客
进程从用户模式变为内核模式的方法就是通过注入中断、故障或陷入系统调用这样的异常。
5.上下文切换
先理解几个概念:
一个进程和其他进程轮流运行的概念称为多任务(multitasking), 多任务也叫做时间分片。
一个进程执行它的控制流的一部分的每一时间段叫做时间片(time slice)。
操作系统内核使用一种称为上下文切换的较高形式的异常控制流来实现多任务。
6.回收子进程
当一个进程由于某种原因终止时,内核并不是立即把它从系统中清除。相反,进程被保持在一种已终止的状态中,直到被它的父进程回收(reaped)。当父进程回收已终止的子进程时,内核将子进程的退出状态传递给父进程,然后抛弃已终止的进程,从此时开始,该进程就不存在了。一个终止了但还未被回收的进程称为僵死进程(zombie)。
7.信号
以上几节介绍了:系统检测到异常发生时,会进入异常处理程序,并切换到内核模式,处理完后视情况不同选择终止程序或返回。
然而,信号是一种软件形式上的异常,允许进程和内核中断其他进程,可以用来通知用户进程发生了哪些异常。
为什么需要信号?我的理解是:当一个程序设计异常,然后在运行的过程中触发了必须终止的异常,这时候如果没有信号,那么在用户眼中就是直接“闪退”,如果有了信号,那么就会弹出一个提示框,提示:。。。。哪里异常,然后点击退出,才会终止程序。
一个信号就是一条小消息,它由内核发出,通知进程系统中发生了一个某种类型的事件。Linux系统支持30种不同类型的信号,信号类型用小整数ID来标识,每种信号类型都对应某种系统事件。
内核发送信号给进程,进程接收到信号后通过一个“信号处理程序”作相应操作。
信号在内核中的表示如下图所示。pending位向量中维护着待处理信号的集合;blocked位向量中维护着被阻塞地信号集合。
只要发送一个类型为k
的信号,内核就会设置pending
中的第k
位,而只要接收了一个类型为k
的信号,内核就会清除pending
中的第k
位。
那么待处理信号和被阻塞信号是怎么回事?
对一个进程而言,同一时刻,同种类型的信号最多只能有一个处于待处理状态,多余的会被直接抛弃,因此同种类型的信号最多同时有两个,一个正处于其对应的信号处理程序,另一个处于待处理状态。另外,进程可以有选择地阻塞某种信号的接收,此时收到的对应类型的信号的待处理位不会标记,只会标记对应的被阻塞位。
总结:
对于汇编语言、CPU、存储器的学习,可能已经使你初步了解应用是如何与硬件交互的。学习异常控制流的重要性在于开始学习应用是如何与操作系统进行交互的。
我们先学习了什么是控制流:处理执行指令的序列,接着我们了解到“异常控制流”,异常控制流可以实现:
- 硬件中断的处理
- 内核控制的上下文切换
- 进程发送信号给另一个进程
接着我们学习了异常控制流的四个类型,再然后了解了进程(逻辑控制流)的概念,以及并发、并行和用户态、内核态的概念。紧接着学习了上下文切换和私有地址空间。最后我们具了解到进程与进程之间的沟通是采用“信号”的。