前文介绍了linux的进程的一些静态特性,这里开始简单描述一下进程是怎么切换的。
首先,什么是进程切换?
进程切换就是为了控制进程的执行,内核挂起正在CPU上运行的进程,并恢复以前挂起的某个进程的行为。
什么时候会切换?
发生schedule()的时候。
都要切换什么?
切换地址空间、内核态堆栈和硬件上下文。
硬件上下文是什么?
进程切换的时候,要把被切出的进程的一些寄存器信息存起来,等到再切回这个进程的时候,要把这组之前存起来的这组数据再写回寄存器里。包括存储着当前指令地址的eip寄存器,当前栈地址的esp寄存器等等。
进程恢复时必须装进寄存器的一组数据,就叫做硬件上下文。
那切换的时候应该把硬件上下文存在哪里呢?
答案是TSS段和进程描述符下的thread字段里。
首先回忆每个CPU都有一个GDT,里面存放了一些段的描述符的地址,其中有一个任务状态段TSS,这个段有一个tss的描述符:
struct tss_struct {
u32 reserved1;
u64 rsp0;
u64 rsp1;
u64 rsp2;
u64 reserved2;
u64 ist[7];
u32 reserved3;
u32 reserved4;
u16 reserved5;
u16 io_bitmap_base;
/*
* The extra 1 is there because the CPU will access an
* additional byte beyond the end of the IO permission
* bitmap. The extra byte must be all 1 bits, and must
* be within the limit. Thus we have:
*
* 128 bytes, the bitmap itself, for ports 0..0x3ff
* 8 bytes, for an extra "long" of ~0UL
*/
unsigned long io_bitmap[IO_BITMAP_LONGS + 1];
} __attribute__((packed)) ____cacheline_aligned;
TSS是每CPU一个,每个进程下还有一个thread字段,用来存放其他的硬件上下文。
struct thread_struct {
unsigned long rsp0;
unsigned long rsp;
unsigned long userrsp; /* Copy from PDA */
unsigned long fs;
unsigned long gs;
unsigned short es, ds, fsindex, gsindex;
/* Hardware debugging registers */
unsigned long debugreg0;
unsigned long debugreg1;
unsigned long debugreg2;
unsigned long debugreg3;
unsigned long debugreg6;
unsigned long debugreg7;
/* fault info */
unsigned long cr2, trap_no, error_code;
/* floating point info */
union i387_union i387;
/* IO permissions. the bitmap could be moved into the GDT, that would make
switch faster for a limited number of ioperm using tasks. -AK */
int ioperm;
unsigned long *io_bitmap_ptr;
/* cached TLS descriptors. */
u64 tls_array[GDT_ENTRY_TLS_ENTRIES];
};
看这个描述符包含的字段就能大概知道切换时要保存哪些寄存器了。
好了,前文提到进程切换要切换地址空间和硬件上下文,地址空间这里不做讨论,主要关注硬件上下文的切换。硬件上下文用switch_to(prev, next, last)宏来实现。是schedule()中的重要一步。
switch_to中大部分功能是汇编语言实现的。我们先关注它的三个参数。
prev和next是入参,容易理解prev代表将要切出的进程,一般是current,next是要替换上来的进程。那么last呢?这里last是一个出参,在执行switch_to宏时,会先把prev写入eax寄存器,在执行完之后,会把eax寄存器中的内容写到last中。我们可以把last理解成切换后的prev的前继。假设现在prev指向A进程,next指向B进程,那么切完后,prev指向的就是B了,此时的last就指向B的前继,也就是A。
为什么要这么做呢?因为进程切换实时上牵扯到三个进程,比如当执行进程A的时候,发生了进程切换,要切到B。在某一时刻,又要执行切换,换回A,但此时正在执行的进程不一定是B了,可能是C进程了。如果没有了这个last变量,那么switch_to执行完,prev已经指向了当初的next,当时的prev就无处可寻了。