第二章 Linux 多进程开发
网络编程系列文章:
第1章 Linux系统编程入门(上)
第1章 Linux系统编程入门(下)
第2章 Linux多进程开发(上)
第2章 Linux多进程开发(下)
第3章 Linux多线程开发
第4章 Linux网络编程
2.1 进程概述
(1)程序和进程
程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程:
-
二进制格式标识:每个程序文件都包含用于描述可执行文件格式的元信息。内核利用此信息来解释文件中的其他信息。(
ELF 可执行连接格式
) -
机器语言指令:对程序算法进行编码。
-
程序入口地址:标识程序开始执行时的起始指令位置。
-
数据:程序文件包含的变量初始值和程序使用的字面量值(比如字符串)。
-
符号表及重定位表:描述程序中函数和变量的位置及名称。这些表格有多重用途,其中包括调试和运行时的符号解析(动态链接)。
-
共享库和动态链接信息:程序文件所包含的一些字段,列出了程序运行时需要使用的共享库,以及加载共享库的动态连接器的路径名。
-
其他信息:程序文件还包含许多其他信息,用以描述如何创建进程。
-
进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。
-
可以用一个程序来创建多个进程,进程是由内核定义的抽象实体,并为该实体分配用 以执行程序的各项系统资源。从内核的角度看,进程由用户内存空间和一系列内核数 据结构组成,其中用户内存空间包含了程序代码及代码所使用的变量,而内核数据结构则用于维护进程状态信息。记录在内核数据结构中的信息包括许多与进程相关的标识号( IDs )、虚拟内存表、打开文件的描述符表、信号传递及处理的有关信息、进程资源使用及限制、当前工作目录和大量的其他信息。
(2)单道、多道程序设计
- 单道程序,即在计算机内存中只允许一个的程序运行。
- 多道程序设计技术 是在计算机内存中同时存放几道相互独立的程序,使它们在管理程序控制下,相互穿插运行,两个或两个以上程序在计算机系统中同处于开始到结束之间的状态 , 这些程序共享计算机系统资源。引入多道程序设计技术的根本目的是为了提高 CPU 的利用率。
- 对于一个单 CPU 系统来说,程序同时处于运行状态只是一种宏观上的概念,他们虽然都已经开始运行,但就微观而言,任意时刻, CPU 上运行的程序只有一个。
- 在多道程序设计模型中,多个进程轮流使用 CPU 。而当下常见 CPU 为 纳秒级, 1 秒可以执行大约 10 亿条指令。由于人眼的反应速度是毫秒级,所以看似同时在运行。
(3)时间片
- 时间片(
timeslice
)又称为“量子 (quantum
)” 或 “处理器片 (processor slice
)是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。事实上,虽然一台计算机通常可能有多个 CPU ,但是同一个 CPU 永远不可能真正地同时运行多个任务。在只考虑一个 CPU 的情况下,这些进程“看起来像”同时运行的,实则是 轮番穿插地运行,由于时间片通常很短(在 Linux 上为 5ms-800ms ),用户不会感觉到。 - 时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应的时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。
(4)并行和并发
- 并行 (
parallel
):指在同一时刻,有多条指令在多个处理器上同时执行。 - 并发 (
concurrency
):指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使多个进程快速交替的执行。
(5)进程控制块(PCB)
-
为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个
PCB(Processing Control Block)
进程控制块,维护进程相关的信息,Linux 内核的进程控制块是task_struct
结构体。 -
在
/usr/src/linux-headers-xxx/include/linux/sched.h
文件中可以查看struct task_struct
结构体定义。其内部成员有很多,我们只需要掌握以下部分即可:-
进程 id :系统中每个进程有唯一的
id
,用pid_t
类型表示,其实就是一个非负整数 -
进程的状态:有就绪、运行、挂起、停止等状态
-
进程切换时需要保存和恢复的一些 CPU 寄存器
-
描述 虚拟地址空间 的信息
-
描述 控制终端 的信息
-
当前工作目录(
Current Working Directory
) -
umask
掩码 -
文件描述符表,包含很多指向
file
结构体的指针 -
和信号相关的信息
-
用户 id
和组 id
-
会话(
Session
)和进程组 -
进程可以使用的资源上限(
Resource Limit
)
-
2.2 进程状态转换
(1)进程的状态
进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中,进程状态分为三个基本状态,即就绪态,运行态,阻塞态。在五态模型中,进程分为新建态、就绪态,运行态,阻塞态,终止态。
- 运行态:进程占有处理器正在运行
- 就绪态:进程具备运行条件,等待系统分配处理器以便运行。当进程已分配到除 CPU 以外的所有必要资源后,只要再获得 CPU ,便可立即执行。在一个系统中处于就绪状态的进程可能有多个,通常将它们排成一个队列,称为就绪队列
- 阻塞态:又称为等待 (
wite
) 态或睡眠 (sleep
) 态,指进程不具备运行条件,正在等待某个事件的完成
- 新建态:进程刚被创建时的状态,尚未进入就绪队列
- 终止态:进程完成任务到达正常结束点,或出现无法克服的错误而异常终止,或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行,但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,操作系统将删除该进程。
(2)进程相关命令
-
查看进程
ps aux / ajx
a
:显示终端上的所有进程,包括其他用户的进程u
:显示进程的详细信息x
:显示没有控制终端的进程j
:列出与作业控制相关的信息
-
STAT(状态) 参数意义:
D
不可中断Uninterruptible
(usually IO
)R
正在运行,或在队列中的进程S
(大写) 处于休眠状态T
停止或被追踪Z
僵尸进程W
进入内存交换(从内核 2.6 开始无效)X
死掉的进程<
高优先级N
低优先级s
包含子进程+
位于前台的进程组
-
实时显示进程动态
top
可以在使用
top
命令时加上-d
来指定显示信息更新的时间间隔,在top
命令执行后,可以按以下按键对显示的结果进行排序:-
M
根据内存使用量排序 -
P
根据 CPU 占有率排序 -
T
根据进程运行时间长短排序 -
U
根据用户名来筛选进程 -
K
输入指定的 PID 杀死进程 -
杀死进程
kill [signal] pid
kill -l
列出所有信号
kill -SIGKILL
进程 ID
kill -9
进程 ID
killall name
根据进程名杀死进程
-
(3) 进程号和相关函数
- 每个进程都由进程号来标识,其类型为
pid_t
(非负整型),进程号的范围0~32767
。进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用。 - 任何进程(除
init
进程)都是由另一个进程创建,该进程称为被创建进程的父进程,对应的进程号称为父进程号(PPID
)。 - 进程组是一个或多个进程的集合。他们之间相互关联,进程组可以接收同一终端的各种信号,关联的进程有一个进程组号(
PGID
)。默认情况下,当前的进程号会当做当前的进程组号。- 进程号和进程组相关函数:
pid_t getpid(void);
pid_t getppid(void);
pid_t getpgid(pid_t pid);
- 进程号和进程组相关函数:
2.3 进程创建
(1)进程创建
系统允许一个进程创建新进程,新进程即为子进程,子进程还可以创建新的子进程,形成进程树结构模型。
返回值:
- 成功:子进程中返回
0
,父进程中返回子进程 ID - 失败:返回
-1
失败的两个主要原因:
- 当前系统的进程数已经达到了系统规定的上限,这时
errno
的值被设置为EAGAIN
- 系统内存不足,这时
errno
的值被设置为ENOMEM
#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
/*
pid_t fork(void);
函数的作用:用于创建子进程。
返回值:
fork()的返回值会返回两次。一次是在父进程中,一次是在子进程中。
在父进程中返回创建的子进程的ID,
在子进程中返回0
如何区分父进程和子进程:通过fork的返回值。
在父进程中返回-1,表示创建子进程失败,并且设置errno
*/
int main() {
int num = 10;
// 创建子进程
pid_t pid = fork();
// 判断是父进程还是子进程
if(pid > 0) {
printf("pid : %d\n", pid);
// 如果大于0,返回的是创建的子进程的进程号,当前是父进程
printf("i am parent process, pid : %d, ppid : %d\n", getpid(),