1.进程的概念
我们知道在计算机系统中,程序是由一组可执行的静态指令集组成,而进程(process)则是一个执行中的程序实例。我们平时写的源代码放在磁盘空间,经过预编译、编译、链接...等过程编译成计算机可以运行的可执行程序,当我们运行我们所编译的可执行程序时,那么一个进程也就产生了。
对于Linux操作系统而言,其利用分时技术,能同时可以运行多个进程。其分时原理:“把CPU的运行时间划分为一个一个规定特定时长的时间片,让每一个进程在一个时间片中运行”。通过操作系统对进程进行统一管理、调度,来时间多个进程仿佛在同时运行一样。(即当一个进程的时间片用完时,系统就可以利用调度程序,将程序切换到另一个进程中去执行)
对于单核CPU的机器来说,某一时刻只能有一个进程在运行,内核通过进程调度程序,分时调用各个进程的运行。在Linux操作系统中,一个进程可以分为在内核态( Kernal mode)和用户态(user mode),因此Linux内核堆栈和用户的堆栈是分开的。用户堆栈用于进程在用户态下临时保存调用函数的信息、局部变量等数据。内核堆栈则含有内核程序执行函数调用时的信息。
2.进程运行环境
内核通过进程表对进程进程统一管理和调度。在Linux系统中,进程表项是一个task_struct任务结构指针。其数据
结构定义在:include/linux/sched.h中。我们通常所说,每个进程都有它自己的进程控制块(PCB)来维护进程相关的
信
息,
其实它就是task_struct结构。其主要信息:
进程id:系统为每一个进程分配一个唯一id,在LinuxC中用pid_t类型表示,其实就是一个非负整数
进程的状态:进程状态有运行、停止、等待、僵尸、休眠等状态
进程切换需要保存和恢复的一些CPU寄存器
描述控制终端的信息
当前进程的工作目录
umask掩码
文件描述符表,包含很多指向file结构体的指针
和信号相关的一些信息
用户id和组id
控制终端、Session和进程组
进程可以使用的资源上限
struct task_struct{
/*任务的运行状态*/
long state;
/*任务运行时间计数(递减)。运行时间片*/
long counter;
/*任务优先级*/
long priority;
/*信号位图,每一位代表一个信号*/
long signal;
/*信号执行数据结构*/
struct sigaction sigaction[32];
/*进程信号屏蔽字*/
long blocked;
/*任务执行停止的退出码,其父进程在回收时会取*/
int exit_code;
/*代码段地址*/
unsigned long start_code;
/*代码长度*/
unsigned long end_code;
/*代码长度+数据长度*/
unsigned long end_data;
/*总长度*/
unsigned long brk;
/*堆栈段地址*/
unsigned long start_stack;
/*进程号*/
long pid;
/*父进程号*/
long father;
/*父进程组号*/
long pgrp;
/*回话号*/
long session;
/*回话首领*/
long leader;
/*用户标识号*/
unsigned short uid;
/*有效用户id*/
unsigned short euid;
/*保存的用户id*/
unsigned short suid;
/*组标识号*/
unsigned short gid;
/*有效组id*/
unsigned short egid;
/*保存的组id*/
unsigned short sgid;
/*报警定时器*/
long alarm;
/*用户态运行时间*/
long utime;
/*内核态运行时间*/
long stime;
/*子进程内核态运行时间*/
long cstime;
/*子进程用户态运行时间*/
long cutime;
/*进程开始运行时刻*/
long start_time;
/*是否使用的协助处理器*/
unsigned short used_math;
/*进程使用tty的子设备号*/
int tty;
/*文件创建属性屏蔽位*/
unsigned short umask;
/*当前工作目录i结点结构*/
struct m_inode *pwd;
/*根目录i节点结构*/
struct m_inode *root;
/*执行文件i节点结构*/
struct m_inode *executable;
/*执行时关闭文件句柄位图标志*/
unsigned long close_on_exec;
/*文件结构指针表*/
struct file *filp[NR_OPEN];
/*任务局部描述符表*/
struct desc_struct;
/*进程的任务状态段信息结构*/
};struct tss_struct tss;
当一个进程在执行时,CPU的所有寄存器中的值,进程的状态以及堆栈中的信息称为当前进程的上下文。当内核需要切换
至另一个进程时,它就需要保存当前进程的所有状态,也即保存当前进程的上下文,以便在再次执行该进程时,能够
回复到切换时的状态执行下去。在Linux中,当前进程上下文均保存在进程的任务数据结构task_struct中。当发生中
断时,
内核就在被中断进程的上下文中,在内核状态下执行中断服务历程。但同时会保留所有需要用到的资源,以便
中断服务结束后
恢复当前进程的运行。
每个进程操作系统都会为它分配相应的虚拟地址空间:
3.进程运行的状态
.运行状态(TASK_RUNNING)
进程正在被CPU调度执行
.可中断睡眠状态(TASK_INTERRUPTIBLE)
当进程处于可中断等待状态,系统不会调度该进程执行。当系统产生一个中断或者释放了进程正在等待的资源
或者进程收到一个信号,都可以唤醒进程转换到就绪状态。
.不可中断睡眠状态(TASK_UNINTERRUPTBLE)
与可中断状态类似。但只能使用wake_up函数才能唤醒该进程
.暂停状态(TASK_STOPPED)
当进程收到信号SIGSTOP,SIGTSTP,SIGTTIN或SIGTTOU就会进入暂停状态。
.僵尸状态(TASK_ZOMBIE)
当进程停止时,其父进程还没有对其回收。
当一个进程的时间片用完,系统就会使用调度程序强制切换到其他的进程去执行。另外,如果进程在内核态执行
需要等待系统的某个资源。此时就会调用进程睡眠函数sleep_on()或者sleep_on_interruptible()资源放弃CPU使用权
,而让调度程序去执行其他程序,进程则进入睡眠状态。
4.进程的初始化
在系统引导目录中的引导程序会吧当前程序从磁盘加载到内存中,并让系统在保护模式下运行后,系统就开始
进程
初始化行为,首先调用init、main.c。该程序首先确认如何分配使用系统物理内存,然后调用内核各部分的初始
化函
数,分别对内存
管理,中断处理,块设备和字符设备,进程管理以及硬盘和软盘进行初始化处理。在完成这些
操作之
后,系统各部分已经
处于可运行状态。此后程序把自己手工移动到任务0中运行,并使用fork调用首次创建出
进程1,在进程1中程序将继续进行
应用环境初始化并执行shell登陆程序。而原进程0则会在系统空闲时被调度执行,
此时任务0仅执行pause系统调用
,并又会调用系统调度函数。