进程是处于执行状态的程序以及它所包含的资源(可执行的代码、一些用户数据、打开的文件、用于保存临时数据的堆栈、挂起的信号等)的总称。从内核角度看,进程是操作系统分配内存、CPU时间片等资源的基本单位,为正在运行的程序提供运行环境。
<1> 进程描述符(task_struct)
每个进程在内核中都有一个进程描述符来维护其相关信息。该结构定义在/include/linux/sched.h中,大致信息包括:
- 进程ID (pid_t类型—unsigned int)
- 进程状态: 运行、挂起、停止、僵尸
- 描述虚拟地址空间信息
- 描述控制终端信息
- 当前工作目录
- umask掩码
- 文件描述符表,包含很多指向file结构体的指针
- 和信号相关的信息
- 用户id和组id
- 控制终端、session和进程组
- 进程可以使用的资源上限(Resource Limit)
<2> 进程在内存中的布局(X86、4GB)
注意: 栈底到task_size之间的位置用于存放命令行参数和环境变量
<3> 进程状态转换图
当发生进程状态切换时,需要保护处理器现场。进场的当前信息保存在自己的PCB内核栈中。
<4> 进程原语
- fork系统调用
#include <unistd.h>
pid_t fork(void);
//调用一次,返回两次。在父进程中返回子进程的PID,在子进程中返回0,出错返回-1。
//采用“读时共享,写时复制”的机制。
//子进程用户空间内用与父进程完全一样,内核空间会产生子进程的PCB。
- exce函数族
使用fork()创建子进程之后,子进程执行的是和父进程相同的代码。但可以使用exec*函数使得子进程执行另一个程序(当进程调用exec*函数时,用户空间地 代码段和数据段完全被新程序替换)。
//例子:使用exec*启动ps命令
char *const ps_argv[] = {"ps", "-o", "pid, ppid, pgrp, sesion, tpgid, comm", NULL};
char *const ps_envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-o", "pid, ppid, pgrp, session, tpgid, comm", NULL);
execlp("ps", "ps", "-o", "pid, ppid, pgrp, session, tpgid, comm", NULL);
execle("/bin/ps", "ps", "-o","pid, ppid, pgrp, session, tpgid, comm", NULL, ps_envp);
execv("/bin/ps", ps_argv);
execvp("ps", ps_argv);
ecexve("/bin/ps", ps_argv, ps_envp);
//p---去PATH中找(不加p就在当前目录中找)
//l----参数以参数列表地形式给出
//v---参数以数组形式给出
//e---设置自己地环境变量(以数组地形式给出)
//不带e的exec*函数只能替换代码段、数据段、堆、栈;
//带e的exec*函数还可以替换环境变量
//每个函数底层调用的都是execve()
wait/waitpid
当一个进程退出时,其资源分两部分来释放:- 其一,用户空间的资源在return时 释放。
- 其二,内核空间其PCB所占资源需要其父进程调用wait/waitpid来获取子进程的退出状态并回收。
处于僵尸态进程的特点: 用户空间的资源已经释放,但是其PCB所占资源还未被释放!
当一个进程正常或异常终止时,内核会想起父进程发送SIGCHLD信号。
1) wait函数
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
//wait函数时阻塞的(当有子进程时阻塞,当无子进程时立即返回-1);
//用于获得任意一个子进程的退出状态并回收子进程PCB。
2) waitpid函数
pid_t waitpid(pid_t pid, int *status, int option);
//指定要回收的子进程。
- 孤儿进程
父进程先于子进程结束,则子进程成为孤儿进程,此时,子进程的父进程会变为1号进程,即init进程领养了孤儿进程。