每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体。
1.进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非负整数。
2.进程的状态,有运行、挂起、停止、僵尸等状态。
3.进程切换时需要保存和恢复的一些CPU寄存器。
4.描述虚拟地址空间的信息。
5.描述控制终端的信息。
6.当前工作目录(Current Working Directory)。
7.umask掩码。
8.文件描述符表,包含很多指向file结构体的指针。
9.和信号相关的信息。
10.用户id和组id。
11.控制终端、Session和进程组。
12.进程可以使用的资源上限(Resource Limit)。
fork
fork的作用是根据一个现有的进程复制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(Child Process)。系统中同时运行着很多进程,这些进程都是从最初只有一个进程开始一个一个复制出来的。在Shell下输入命令可以运行一个程序,是因为Shell进程在读取用户输入的命令之后会调用fork复制出一个新的Shell进程,然后新的Shell进程调用exec执行新的程序。
我们知道一个程序可以多次加载到内存,成为同时运行的多个进程,例如可以同时开多个终端窗口运行/bin/bash,另一方面,一个进程在调用exec前后也可以分别执行两个不同的程序,例如在Shell提示符下输入命令ls,首先fork创建子进程,这时子进程仍在执行/bin/bash程序,然后子进程调用exec执行新的程序/bin/ls,如下图所示:
fork/exec
环境变量
exec系统调用执行新程序时会把命令行参数和环境变量表传递给main函数,它们在整个进程地址空间中的位置如下图所示。
和命令行参数argv类似,环境变量表也是一组字符串,如下图所示。