什么是进程,什么是线程?
进程是资源管理及分配的最小单元;而线程是程序执行的最小单元。一个进程的组成实体可以分为两大部分:线程集和资源集。在现代操作系统中,进程支持多线程,进程中的线程是动态的对象,代表了进程指令的执行过程。资源,包括地址空间、打开的文件、用户信息等等,由进程内的线程共享。在linux中,线程是一种特殊的进程,是一种轻量级的进程。
Linux线程的实现
Linux线程是通过进程来实现。Linux kernel为进程创建提供一个clone()系统调用,clone的参数包括如 CLONE_VM, CLONE_FS,CLONE_FILES, CLONE_SIGHAND 等。通过clone()的参数,新创建的进程,也称为LWP(Lightweight process)与父进程共享内存空间,文件句柄,信号处理等,从而达到创建线程相同的目的。
什么是进程描述符?
为了管理进程,操作系统必须对每个进程所做的事情进行清楚地描述,为此,操作系统使用数据结构来代表处理不同的实体,这个数据结构就是通常所说的进程描述符。
进程描述符结构
linux每个进程对应一个task_struct类型结构。该结构包含进程相关的所有信息。linux进程通过list_head组织双向链表,每一个结点就是一个进程描述符。进程描述符里面包含了进程所有的信息:进程所打开的文件、进程的地址空间、挂起信号、进程状态和其他更多的信息。以下是进程描述符的部分定义:
1: shruct task_struct
2: {
3: unsigned long state; //进程的状态,在2.6.23已经有9个状态
4: unsigned long policy; //描述进程调度策略.判断是实时进程还是非实时进程
5: struct task_struct *parent; //组织进程的层次关系,指向父进程
6: struct list_head tasks; //通过list_head组织成双向链表
7: pid_t pid; //每个进程唯一的标号
8: ......
9: };
进程描述符里面有一个pid,它就是进程间区别标志。它实际上是一个短整型数据,也就是说它最大值为32767。
linux通过slab分配器分配task-struct结构。这样能做到对象复用,减少动态分配和释放带来的资源消耗。