进程相关概念
程序是存储在硬盘上的代码文件,是静态的概念;进程是正在运行的程序实例,是动态的概念。一个程序可以创建多个进程(例如你可以在一台电脑上登录两个QQ)。
单道程序,即在计算机内存中只允许一个程序运行
多道程序设计是在计算机内存中同时存放几道相互独立的程序,使他们在管理程序控制之下,相互穿插运行,两个或两个以上程序在计算机系统中同处于开始到结束之间的状态, 这些程序共享计算机系统资源。引入多道程序设计技术的根本目的是为了提高 CPU 的利用率,即宏观上并行,微观上并发。多个进程轮流使用CPU,但每一时刻只有一个进程能得到CPU。
时间片又称为“量子”或“处理器片”是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。事实上,虽然一台计算机通常可能有多个 CPU,但是同一个 CPU 永远不可能真正地同时运行多个任务。在只考虑一个 CPU 的情况下,这些进程“看起来像”同时运行的,实则是轮番穿插地运行,由于时间片通常很短(在 Linux 上为 5ms-800ms),用户不会感觉到。
时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应的时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。
并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行。
并发(concurrency):指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使多个进程快速交替的执行。
PCB 为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个 PCB(Processing Control Block)进程控制块,维护进程相关的信息,Linux 内核的进程控制块是 task_struct 结构体。
进程状态
三态模型:就绪态、运行态、阻塞态
运行态:进程占有处理机正在运行
就绪态:进程有了除处理机外的其他所有所需的资源,只要一占有CPU就能马上运行
阻塞态:进程缺少某些必要的运行资源(非CPU)而不能运行。
Linux有关进程的命令
查看进程
ps aux / ajx a:显示终端上的所有进程,包括其他用户的进程
u:显示进程的详细信息
x:显示没有控制终端的进程
j:列出与作业控制相关的信息
PPID 父进程的进程id
PID 进程的id
%CPU CPU占有率
%MEM 存储器占有率
PGID 进程组的id
SID 会话的id
STAT参数意义:
D 不可中断 Uninterruptible(usually IO)
R 正在运行,或在队列中的进程
S(大写) 处于休眠状态
T 停止或被追踪
Z 僵尸进程
W 进入内存交换(从内核2.6开始无效)
X 死掉的进程
< 高优先级
N 低优先级
s 包含子进程
+ 位于前台的进程组
实时显示进程动态
top
可以在使用 top 命令时加上 -d 来指定显示信息更新的时间间隔,在 top 命令
执行后,可以按以下按键对显示的结果进行排序:
M 根据内存使用量排序
P 根据 CPU 占有率排序
T 根据进程运行时间长短排序
U 根据用户名来筛选进程
K 输入指定的 PID 杀死进程
杀死进程
kill 进程ID
kill [-signal] pid
kill –l 列出所有信号
kill –SIGKILL 进程ID
kill -9 进程ID
killall name 根据进程名杀死进程
- 每个进程都由进程号来标识,其类型为 pid_t(整型),进程号的范围:0~32767。
进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用。 - 任何进程(除 init 进程)都是由另一个进程创建,该进程称为被创建进程的父进程,
对应的进程号称为父进程号(PPID)。 - 进程组是一个或多个进程的集合。他们之间相互关联,进程组可以接收同一终端的各
种信号,关联的进程有一个进程组号(PGID)。默认情况下,当前的进程号会当做当
前的进程组号。 - 进程号和进程组相关函数:
- pid_t getpid(void);
- pid_t getppid(void);
- pid_t getpgid(pid_t pid)
进程创建
-
sys/type.h、unistd.h
-
pid_t fork(void);
-
返回值:
-成功 : 子进程中返回0,父进程中返回子进程ID
-失败:返回-1(在父进程中返回) -
失败的两个主要原因:
-当前系统的进程数已经达到了系统规定的上限,这时 errno 的值被设置为 EAGAIN
-系统内存不足,这时 errno 的值被设置为 ENOMEM -
为了提高效率,fork函数在一开始创建子进程的时候并不会完整复制父进程的地址空间,而是和父进程共享地址空间(读共享)。当发现父(或子)进程要修改数据时,才会复制地址空间
GDB多进程调试
使用 GDB 调试的时候,GDB 默认只能跟踪一个进程,可以在 fork 函数调用之前,通过指令设置 GDB 调试工具跟踪父进程或者是跟踪子进程,默认跟踪父进程。
设置调试父进程或者子进程:set follow-fork-mode [parent(默认)| child]
设置调试模式:set detach-on-fork [on | off]
默认为 on,表示调试当前进程的时候,其它的进程继续运行,如果为 off,调试当前进程的时候,其它进程被 GDB 挂起。
查看调试的进程:info inferiors
切换当前调试的进程:inferior id
使进程脱离 GDB 调试:detach inferiors id
execl函数族
- exec 函数族的作用是根据指定的文件名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。
- exec 函数族的函数执行成功后不会返回,因为调用进程的实体,包括代码段,数据段和堆栈等都已经被新的内容取代,只留下进程 ID 等一些表面上的信息仍保持原样,颇有些神似“三十六计”中的“金蝉脱壳”。看上去还是旧的躯壳,却已经注入了新的灵魂。只有调用失败了,它们才会返回 -1,从原程序的调用点接着往下执行。
int execl(const char *path, const char *arg, .../* (char *) NULL */);
int execlp(const char *file, const char *arg, ... /* (char *) NULL */);
int execle(const char *path, const char *arg, .../*, (char *) NULL, char * const envp[] */);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[], char *const envp[]);
int execve(const char *filename, char *const argv[], char *const envp[]);
l(list) 参数地址列表,以空指针结尾
v(vector) 存有各参数地址的指针数组的地址
p(path) 按 PATH 环境变量指定的目录搜索可执行文件
e(environment) 存有环境变量字符串地址的指针数组的地址
#include <unistd.h>
int execl(const char *path, const char *arg, .../* (char *) NULL */);
-path 需要使用的可执行文件的路径或者名称
-arg 执行可执行文件所需要的参数列表
第一个参数一般没什么作用,为了方便,一般写的是执行的程序名称
从第二个参数开始往后,就是程序执行所需要的参数列表
参数最后需要以NULL结尾
-return
只有调用出错时才返回-1.
int execlp(const char *file, const char *arg, ... /* (char *) NULL */);
会到环境变量中查找指定的可执行文件,如果找到了就执行,找不到就执行不成功
-file 需要执行的可执行文件的文件名
-arg 执行可执行文件所需要的参数列表
第一个参数一般没什么作用,为了方便,一般写的是执行的程序名称
从第二个参数开始往后,就是程序执行所需要的参数列表
参数最后需要以NULL结尾
-return
只有调用出错时才返回-1.
孤儿进程
父进程运行结束,但子进程还在运行(未运行结束),这样的子进程就称为孤儿进程(Orphan Process)。
每当出现一个孤儿进程的时候,内核就把孤儿进程的父进程设置为 init ,而 init 进程会循环地 wait() 它的已经退出的子进程。这样,当一个孤儿进程凄凉地结束了其生命周期的时候,init 进程就会代表党和政府出面处理它的一切善后工作。因此孤儿进程并不会有什么危害。
僵尸进程
每个进程结束之后, 都会释放自己地址空间中的用户区数据,内核区的 PCB 没有办法自己释放掉,需要父进程去释放。进程终止时,父进程尚未回收,子进程残留资源(PCB)存放于内核中,变成僵尸(Zombie)进程。
僵尸进程不能被 kill -9 杀死,这样就会导致一个问题,如果父进程不调用 wait() 或 waitpid() 的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵尸进程,将因为没有可用的进程号而导致系统不能产生新的进程,此即为僵尸进程的危害,应当避免。
进程回收
在每个进程退出的时候,内核释放该进程所有的资源、包括打开的文件、占用的内存等。但是仍然为其保留一定的信息,这些信息主要主要指进程控制块PCB的信息(包括进程号、退出状态、运行时间等)。父进程可以通过调用wait或waitpid得到它的退出状态同时彻底清除掉这个进程。
wait() 和 waitpid() 函数的功能一样,区别在于,wait() 函数会阻塞,waitpid() 可以设置不阻塞,waitpid() 还可以指定等待哪个子进程结束。
注意:一次wait或waitpid调用只能清理一个子进程,清理多个子进程应使用循环
wait函数
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *wstatus);
作用:等待任意一个子进程结束,如果任意一个子进程结束了,此函数会回收子进程资源
参数
-wstatus 进程退出时的状态信息,传入的是一个int类型的地址,传出参数
-return
成功:返回被回收的子进程的id
失败:-1(所有的子进程都结束,调用函数失败)
调用wait函数的进程会被挂起(阻塞),知道它的一个子进程退出或者收到一个不能被忽略的信号时才被唤醒(相当于继续往下执行)
如果没有子进程了或子进程都结束了,函数立刻返回-1;
退出信息相关宏函数
◼ WIFEXITED(status) 非0,进程正常退出
◼ WEXITSTATUS(status) 如果上宏为真,获取进程退出的状态(exit的参数)
◼ WIFSIGNALED(status) 非0,进程异常终止
◼ WTERMSIG(status) 如果上宏为真,获取使进程终止的信号编号
◼ WIFSTOPPED(status) 非0,进程处于暂停状态
◼ WSTOPSIG(status) 如果上宏为真,获取使进程暂停的信号的编号
◼ WIFCONTINUED(status) 非0,进程暂停后已经继续运行
waitpid函数
#include <sys/types.h>
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *wstatus, int options);
作用:回收指定进程号的子进程,可以设置是否阻塞
参数
-pid
>0 表示回收的子进程的pid
=0 回收当前进程组的所有子进程
=-1 回收所有的子进程,相当于wait()
<-1 回收某个进程组的组id(绝对值)的子进程
-wstatus 进程退出时的状态信息,传入的是一个int类型的地址,传出参数
-options
0 阻塞
1 非阻塞
-return
>0:返回被回收的子进程的id
= 0,表示还有子进程
-1:失败(所有的子进程都结束,调用函数失败)
调用wait函数的进程会被挂起(阻塞),知道它的一个子进程退出或者收到一个不能被忽略的信号时才被唤醒(相当于继续往下执行)
如果没有子进程了或子进程都结束了,函数立刻返回-1;