首先我们得了解什么是进程和task_struct,下面我们先看看进程的概念:
1.进程的概念
进程是程序一次动态的执行过程(程序一般是以物理文件的形式储存在硬盘等存储媒介中),进程可以看成是在内存中正在运行的程序。进程=程序段+数据段+进程控制块(看下文)。
我们从以下两个方面看进程:
从操作系统来看:进程是程序的一个执行实例,进程是正在执行的程序,进程是能分配处理机并且由处理机执行的实体。被加载到内存的程序都是进程,进程有很多状态(linux下有执行;睡眠;暂停;死亡;僵尸等)
从内核来看:进程担当分配系统资源(包括内存等)的实体。进程的两个基本元素是程序代码和与代码相关联的数据集。
2.进程控制块
为了描述进程的信息,我们引入了进程控制块这个数据结构。
每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,linux下的PCB–task_struct结构体。
那么进程控制块的作用到底是什么呢?
比如在单处理机系统中,我们每次只能执行一个进程,我们怎么知道在执行哪个进程呢?执行完这个进程又要去执行哪个进程呢?又或者一个进程被中断,执行完别的进程之后再来执行这个进程,又怎么实现呢?所以就需要进程控制块来保存进程信息。
那我们就来看看linux下的进程控制块(task_struct结构体的内容)
通过以上简单的分析,我们得出进程控制块至少应该包含进程标识(PID),进程优先级(PRI),进程中的程序的地址。当操作系统要去调度某进程去执行时,要从该进程的PCB中查询进程的优先级和现行状态;当系统调度到某个进程时,要根据PCB中保存的现行信息先去回复系统调用,然后再去修改进程的状态,根据程序的地址,找到程序的位置,并开始执行;当进程由于某个原因被中断时,就必须把目前状态保存在PCB中,并记录下一条指令的地址。由此可见PCB对进程的重要性
3.task_struct(结构体)对数据成员分类为:
centos6.5环境下task_struct的定义位置(/usr/include/linux/sched.h)
1)进程状态:volatile long state
state的可能取值:
#define TASK_RUNNING 0//进程要么正在执行,要么准备执行
#define TASK_INTERRUPTIBLE 1 //可中断的睡眠,可以通过一个信号唤醒
#define TASK_UNINTERRUPTIBLE 2 //不可中断睡眠,不可以通过信号进行唤醒
#define __TASK_STOPPED 4 //进程停止执行
#define __TASK_TRACED 8 //进程被追踪
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16 //僵尸状态的进程,表示进程被终止,但是父进程还没 有获取它的终止信息,比如进程有没有执行完等信息。
#define EXIT_DEAD 32 //进程的最终状态,进程死亡。
/* in tsk->state again */
#define TASK_DEAD 64 //死亡
#define TASK_WAKEKILL 128 //唤醒并杀死的进程
#define TASK_WAKING 256 //唤醒进程
2)进程标识
pid_t pid;//进程的唯一标识
pid_t tgid;// 线程组的领头线程的pid成员的值
pid是进程的唯一标识,范围(0~32767),可以表示32768个进程。在Linux系统中,一个线程组的所有线程使用和该线程组的领头线程相同的PID,并被存放在tgid成员中。(线程是程序运行的最小单位,进程是程序运行的基本单位。)
3)进程的内核栈
void *stack;//用来维护进程的内核栈。
linux内核是通过以下的结构体来表示进程的内核栈:
union thread_union {
struct thread_info thread_info;
unsigned long stack[THREAD_SIZE/sizeof(long)];
};
4)进程的标记
unsigned int flags;
//进程的标志信息
#define PF_ALIGNWARN 0x00000001 /* Print alignment warning msgs */
/* Not implemented yet, only for 486*/
#define PF_STARTING 0x00000002 /* being created */
#define PF_EXITING 0x00000004 /* getting shut down */
#define PF_EXITPIDONE 0x00000008 /* pi exit done on shut down