第八章-进程控制
1进程相关概念
1.1 程序和进程
- 程序,是指编译好的二进制文件,在磁盘上,占用磁盘空间, 是一个静态的概念.
- 进程,一个启动的程序, 进程占用的是系统资源,如:物理内存,CPU,终端等,是一个动态的概念
- 程序 → 剧本(纸)
- 进程 → 戏(舞台、演员、灯光、道具…)
1.2 并行和并发
并发,在一个时间段内, 是在同一个cpu上, 同时运行多个程序。
- 如:若将CPU的1S的时间分成1000个时间片,每个进程执行完一个时间片必须无条件让出CPU的使用权,这样1S中就可以执行1000个进程。
并行性指两个或两个以上的程序在同一时刻发生(需要有多颗)。
1.3 进程控制块
每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体。
/usr/src/linux-headers-4.4.0-96/include/linux/sched.h文件的1390行处可以查看struct task_struct 结构体定义。其内部成员有很多,我们重点掌握以下部分即可:
- 进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非负整数。
- 进程的状态,有就绪、运行、挂起、停止等状态。
- 进程切换时需要保存和恢复的一些CPU寄存器。
- 描述虚拟地址空间的信息。
- 描述控制终端的信息。
- 当前工作目录(Current Working Directory)。
getcwd --pwd - umask掩码。
- 文件描述符表,包含很多指向file结构体的指针。
- 和信号相关的信息。
- 用户id和组id。
- 会话(Session)和进程组。
- 进程可以使用的资源上限(Resource Limit)。
ulimit -a
1.4 进程标志
进程ID是唯一的,常将其用作其他标志符的一部分以保证其唯一性。虽然是唯一的,但是进程ID是可以复用的。当一个进程终止以后,其进程ID就被释放,可被其他新创建的进程获得。
系统中有一些专用进程,但其具体细节随实现而不同。ID为0的进程通常是调度进程,常常被称作交换进程,也被称作系统进程。该进程是内核的一部分,并不执行磁盘上的程序。进程ID为1的进程被称作init进程,它绝不会终止。
1.5进程状态(面试考)
进程基本的状态有5种。分别为初始态,就绪态,运行态,挂起态与终止态。其中初始态为进程准备阶段,常与就绪态结合来看。
2 创建进程
2.1 fork函数
函数作用:创建子进程
原型: pid_t fork(void);
函数参数:无
返回值:
- 调用成功:父进程返回子进程的PID,子进程返回0;
- 调用失败:返回-1,设置errno值。
调用fork函数的内核实现原理:
父子进程之间的文件共享
fork的是一个特性就是父进程的所有打开文件描述符都被复制到子进程中,并且特殊的是,父子进程每个相同的打开描述符共享一个文件表项,因此共享一个文件偏移量。这样是一个好处是,当父进程已连接到标准输出,那么其子进程写到该标准输出时,他将更新与父进程共享的该文件的偏移量,比如,当父进程写到标准输出后,文件偏移量的更新被父子进程共享,因此子进程再往标准输出写就是以追加的形式。
fork函数总结:
1 fork函数的返回值?
- 父进程返回子进程的PID,是一个大于0数;
- 子进程返回0;
特别需要注意的是:不是fork函数在一个进程中返回2个值,而是在父子进程各自返回一个值。
2 子进程创建成功后,代码的执行位置?
- 父进程执行到什么位置,子进程就从哪里执行
3 如何区分父子进程?
通过fork函数的返回值
4 父子进程的执行顺序?
不确定,哪个进程先抢到CPU,哪个进程就先执行。
2.2 ps命令和kill命令
ps aux | grep “xxx”
ps ajx | grep “xxx”
- -a:(all)当前系统所有用户的进程
- -u:查看进程所有者及其他一些信息
- -x:显示没有控制终端的进程 – 不能与用户进行交互的进程【输入、输出】
- -j: 列出与作业控制相关的信息
kill -l 查看系统有哪些信号
kill -9 pid 杀死某个线程
2.3 getpid/getppid
getpid - 得到当前进程的PID
- pid_t getpid(void);
getppid - 得到当前进程的父进程的PID
- pid_t getppid(void);
(另外一些不需要掌握:
uid_t getuid()—得到进程的实际用户ID
uid_t geteuid()—进程的有效用户ID
gid_t getgid()—返回进程的实际组ID
gid_t geteuid()— 返回进程的有效组ID)
2.4练习
1)fork函数测试
//fork函数测试
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
int g_var = 99;
int main()
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
printf("father: [%d], pid==[%d], fpid==[%d]\n", pid, getpid(),getppid());
g_var++;
printf("[%p]", &g_var);
}
else if(pid==0) //子进程
{
sleep(1); //为了避免父进程还没有执行, 子进程已经结束了
printf("[%p]", &g_var);
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
printf("child: g_var==[%d]\n", g_var);
}
return 0;
}
2)循环创建多个子进程
/循环创建n个子进程
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
int i = 0;
for(i=0; i<3; i++)
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
printf("father: pid==[%d], fpid==[%d]\n", getpid(),getppid());
//sleep(1);
}
else if(pid==0) //子进程
{
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
break;
}
}
//第1个子进程
if(i==0)
{
printf("[%d]--[%d]: child\n", i, getpid());
}
//第2个子进程
if(i==1)
{
printf("[%d]--[%d]: child\n", i, getpid());
}
//第3个子进程
if(i==2)
{
printf("[%d]--[%d]: child\n", i, getpid());
}
//父进程
if(i==3)
{
printf("[%d]--[%d]: child\n", i, getpid());
}
sleep(10);
return 0;
}
2.5 补充
子进程是将父进程的数据空间、堆栈等复制出来了,之后两者中的数据变化不会影响彼此。不光是全局变量,局部变量(栈)和动态内存(堆)都不共享。唯一的例外是,由于父进程中的内核区的pcb中的所有的文件描述符都被复制到子进程中,父子进程能够实现文件共享。
3 exec函数族
3.1 函数作用和函数介绍
有的时候需要在一个进程里面执行其他的命令或者是用户自定义的应用程序,此时就用到了exec函数族当中的函数。用exec函数可以把当前进程替换为一个新进程,且新进程与原进程有相同的PID。当进程调用exec时,该进程执行的程序完全替换为新程序,而新程序则从其main函数开始执行。exec函数并不创建新进程,只是用磁盘上的一个新程序替换了当前程序的正文段、数据段和堆栈。
使用方法一般都是在父进程里面调用fork创建处子进程,然后在子进程里面调用exec函数。
execl函数:
函数原型: int execl(const char *path, const char arg, … / (char *) NULL */);
参数介绍:
- path: 要执行的程序的绝对路径
- 变参arg: 要执行的程序的需要的参数
- arg:占位,通常写应用程序的名字
- arg后面的: 命令的参数
- 参数写完之后: NULL
返回值:若是成功,则不返回,不会再执行exec函数后面的代码;若是失败,会执行execl后面的代码,可以用perror打印错误原因。
execl函数一般执行自己写的程序。
execlp函数
函数原型: int execlp(const char *file, const char arg, …/ (char *) NULL */);
参数介绍:
- file: 执行命令的名字, 根据PATH环境变量来搜索该命令
- arg:占位
- arg后面的: 命令的参数
- 参数写完之后: NULL
- 返回值:若是成功,则不返回,不会再执行exec函数后面的代码;若是失败,会执行exec后面的代码,可以用perror打印错误原因。
execlp函数一般是执行系统自带的程序或者是命令。
3.2 exec函数族原理介绍
exec族函数的实现原理图:
如:execlp(“ls”, “ls”, “-l”, NULL);
总结:
exec函数是用一个新程序替换了当前进程的代码段、数据段、堆和栈;原有的进程空间没有发生变化,并没有创建新的进程,进程PID没有发生变化。
3.3 exec函数练习
#include <sys/types.h>
#include <unistd.h>
int main()
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
printf("father: [%d], pid==[%d], fpid==[%d]\n", pid, getpid(),getppid());
//sleep(1);
}
else if(pid==0) //子进程
{
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
//execl("/bin/ls", "ls", "-l", NULL);
//execl("./test", "test", "hello", "world", "ni", "hao", NULL);
//execlp("ls", "ls", "-l", NULL);
execlp("./test", "TESTING", "hello", "world", "ni", "hao", NULL);
//execlp("./iitest", "test", "hello", "world", "ni", "hao", NULL);
perror("execl error");
}
return 0;
}
注意:当execl和execlp函数执行成功后,不返回,并且不会执行execl后面的代码逻辑,原因是调用execl函数成功以后,exec函数指定的代码段已经将原有的代码段替换了。
4 进程回收
4.1 为什么要进行进程资源的回收
当一个进程退出之后,进程能够回收自己的用户区的资源,但是不能回收内核空间的PCB资源,必须由它的父进程调用wait或者waitpid函数完成对子进程的回收,避免造成系统资源的浪费。
4.2 孤儿进程和僵尸进程
孤儿进程:
- 若子进程的父进程已经死掉,而子进程还存活着,这个进程就成了孤儿进程。
- 为了保证每个进程都有一个父进程,孤儿进程会被init进程领养,init进程成为了孤儿进程的养父进程,当孤儿进程退出之后,由init进程完成对孤儿进程的回收。
案例:编写模拟孤儿进程的代码讲解孤儿进程,验证孤儿进程的父进程是否由原来的父进程变成了init进程。
//孤儿进程
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
sleep(5);
printf("father: [%d], pid==[%d], fpid==[%d]\n", pid, getpid(),getppid());
}
else if(pid==0) //子进程
{
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
sleep(20);
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
}
return 0;
}
僵尸进程:
若子进程死了,父进程还活着, 但是父进程没有调用wait或waitpid函数完成对子进程的回收,则该子进程就成了僵尸进程。ps(1)命令将僵尸进程的状态打印为Z。
如何解决僵尸进程?
- 由于僵尸进程是一个已经死亡的进程,所以不能使用kill命令将其杀死。
- 通过杀死其父进程的方法可以消除僵尸进程。杀死其父进程后,这个僵尸进程会被init进程领养,由init进程完成对僵尸进程的回收。
//僵尸进程
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
sleep(100);
printf("father: [%d], pid==[%d], fpid==[%d]\n", pid, getpid(),getppid());
}
else if(pid==0) //子进程
{
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
}
return 0;
}
4.3进程回收函数
1)wait函数:
函数原型:pid_t wait(int *status);
函数作用:
- 阻塞并等待子进程退出 。
- 回收子进程残留资源 。
- 获取子进程结束状态(退出原因)。
返回值:
- 成功:清理掉的子进程ID;
- 失败:-1 (没有子进程)
status参数:子进程的退出状态 – 传出参数
- WIFEXITED(status):为非0 → 进程正常结束
WEXITSTATUS(status):获取进程退出状态 - WIFSIGNALED(status):为非0 → 进程异常终止
WTERMSIG(status):取得进程终止的信号编号。
wait函数练习:
//父进程调用wait函数完成对子进程的回收
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/wait.h>
int main()
{
//创建子进程
pid_t pid = fork();
if(pid<0) //fork失败的情况
{
perror("fork error");
return -1;
}
else if(pid>0)//父进程
{
printf("father: [%d], pid==[%d], fpid==[%d]\n", pid, getpid(),getppid());
int status;
pid_t wpid = wait(&status);
printf("wpid==[%d]\n", wpid);
if(WIFEXITED(status)) //正常退出
{
printf("child normal exit, status==[%d]\n", WEXITSTATUS(status));
}
else if(WIFSIGNALED(status)) //被信号杀死
{
printf("child killed by signal, signo==[%d]\n", WTERMSIG(status));
}
}
else if(pid==0) //子进程
{
printf("child: pid==[%d], fpid==[%d]\n", getpid(), getppid());
sleep(20);
return 9;
}
return 0;
}
2)waitpid函数
函数原型:pid_t waitpid(pid_t pid, int *status, in options);
函数作用:wait函数
函数参数
- 参数pid
pid = -1 等待任一子进程。与wait等效。
pid > 0 等待其进程ID与pid相等的子进程。
pid = 0 等待进程组ID与目前进程相同的任何子进程,也就是说任何和调用waitpid()函数的进程在同一个进程组的进程。
pid < -1 等待其组ID等于pid的绝对值的任一子进程。(适用于子进程在其他组的情况) - status: 子进程的退出状态,用法同wait函数。
- options:设置为WNOHANG,函数非阻塞,设置为0,函数阻塞。
- 函数返回值
> 0:返回回收掉的子进程ID;
-1:无子进程
=0:是在参3为WNOHANG,且子进程正在运行。
waitpid函数练习:使用waitpid函数完成对子进程的回收。
待补充
5 进程终止 exit函数
进程正常终止的5种方式:
- 在main中调用return,这相当于调用exit
- 调用exit函数
- 调用_exit或_Exit函数(在UNIX中两者是同义的)
- 进程的最后一个线程在其启动例程中执行return语句。当最后一个线程从其启动例程中返回时,该进程以终止状态0返回。
- 进程的最后一个线程调用pthread_exit函数。
下面是调用exit终止的过程。
另外还有三种异常终止,这里不做展开。
不管是哪种终止方式,该终止进程的父进程都能够调用wait或者是waitpid获取其终止状态。
一个程序终止以后,内核还保留了一定量的信息,所以父进程要对其进行回收,负责会变成僵尸进程。