进程控制与进程关系

最新推荐文章于 2023-04-17 18:20:09 发布

DenzilXu

最新推荐文章于 2023-04-17 18:20:09 发布

阅读量1.1k

点赞数

分类专栏： Linux

本文链接：https://blog.csdn.net/DenzilXu/article/details/8836307

版权

Linux 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1 进程ID

fd分配是对一个进程内部而言的，每个进程内的fd是相互独立的。而进程的ID确实整个系统统一分配的。

每个进程都有一个非负整型的唯一进程ID。因为进程ID标识符总是唯一的，常将其用做其他标识符的一部分以保证其唯一性。

有某些专用的进程：进程ID 0是调度进程，常常被称为交换进程( swapper )。该进程并不执行任何磁盘上的程序—它是内核的一部分，因此也被称为系统进程。进程ID 1通常是init进程，在自举过程结束时由内核调用。该进程的程序文件在UNIX的早期版本中是/etc/init，在较新版本中是/sbin/init。此进程负责在内核自举后起动一个UNIX系统。init通常读与系统有关的初始化文件( /etc/rc*文件)，并将系统引导到一个状态(例如多用户)。init进程决不会终止。它是一个普通的用户进程(与交换进程不同，它不是内核中的系统进程)，但是它以超级用户特权运行。init是所有孤儿进程的父进程。

除了进程ID，每个进程还有一些其他标识符。下列函数返回这些标识符。

#include <sys/types.h>

#include <unistd.h>

pid_t getpid(void); 返调用进程的进程I D

pid_t getppid(void); 返回：调用进程的父进程I D

uid_t getuid(void); 返回：调用进程的实际用户I D

uid_t geteuid(void); 返回：调用进程的有效用户I D

gid_t getgid(void); 返回：调用进程的实际组I D

gid_t getegid(void); 返回：调用进程的有效组I D

2 fork

2.1 fork函数

一个现存进程调用fork函数是UNIX一个新进程的唯一方法(这并不适用于前节提及的交换进程、init进程。这些进程是由内核作为自举过程的一部分以特殊方式创建的)。

#include <sys/types.h>

#include <unistd.h>

pid_t fork(void);

返回：子进程中为0，父进程中为子进程I D，出错为-1

由fork创建的新进程被称为子进程（child process）。该函数被调用一次，但返回两次。两次返回的区别是子进程的返回值是0，而父进程的返回值则是新子进程的进程ID。将子进程ID返回给父进程的理由是：因为一个进程的子进程可以多于一个，所以没有一个函数使一个进程可以获得其所有子进程的进程ID，fork子进程得到返回值0的理由是：一个进程只会有一个父进程，所以子进程总是可以调用getppic以获得其父进程的进程ID (进程ID 0总是由交换进程使用，所以一个子进程的进程I D不可能为0 )。

子进程和父进程继续执行fork之后的指令。子进程是父进程的复制品。例如，子进程获得父进程数据空间、堆和栈的复制品。注意，这是子进程所拥有的拷贝。父、子进程并不共享这些存储空间部分。如果正文段是只读的，则父、子进程共享正文段(见前一章图)。

高级编程清单8-1说明了父子进程使用的变量是不同的副本，以及标准输出行缓冲和重定向全缓冲时父子进程输出结果不同的原因。

2.2 文件共享

ch3文件共享一节提及了多个文件描述符项可指向同一文件表项，如dup、fork。而fork用于在进程间共享file结构，此时父、子进程对于每一个打开的文件描述符共享同一个文件表项。这里进一步说明。

在重新定向父进程的标准输出时，子进程的标准输出也被重新定向。实际上， fork的一个特性是所有由父进程打开的描述符都被复制到子进程中。父、子进程每个相同的打开描述符共享一个文件表项(见ch3图)。考虑下述情况，一个进程打开了三个不同文件，它们是：标准输入、标准输出和标准出错。在从fork返回时，我们有了如下图中所示的安排。

fork有两种用法：

(1) 一个父进程希望复制自己，使父、子进程同时执行不同的代码段。这在网络服务进程中是常见的——父进程等待委托者的服务请求。当这种请求到达时，父进程调用fork，使子进程处理此请求。父进程则继续等待下一个服务请求。

(2) 一个进程要执行一个不同的程序。这对shell是常见的情况。在这种情况下，子进程在从fork返回后立即调用exec。

2.3 vfork

vfork函数的调用序列和返回值与fork相同，但两者的语义不同。vfork与fork一样都创建一个子进程，但是它并不将父进程的地址空间完全复制到子进程中，因为子进程会立即调用exec (或exit )，于是也就不会存访该地址空间。不过在子进程调用exec或exit之前，它在父进程的空间中运行。

这种工作方式在某些UNIX的页式虚存实现中提高了效率（与cow写时复制技术相类似）。

vfork和fork之间的另一个区别是： vfork保证子进程先运行，在它调用exec或exit之后父进程才可能被调度运行。（如果在调用这两个函数之前子进程依赖于父进程的进一步动作，则会导致死锁。）

3 wait、waitpid

如同前面所述，进程有三种正常终止法及两种异常终止法。

(1) 正常终止：

(a) 在main函数内执行return语句。如在ch5中所述，这等效于调用exit。

(b) 调用exit函数。此函数由ANSI C定义，其操作包括调用各终止处理程序（终止处理程序在调用a t e x i t函数时登录），然后关闭所有标准I/O流等。

(2) 异常终止：

(a) 调用abort。它产生SIGABRT信号，所以是下一种异常终止的一种特例。

(b) 当进程接收到某个信号时，进程本身（例如调用abort函数）、其他进程和内核都能产生传送到某一进程的信号。例如，进程越出其地址空间访问存储单元，或者除以0，内核就会为该进程产生相应的信号。

不管进程如何终止，最后都会执行内核中的同一段代码。这段代码为相应进程关闭所有打开描述符，释放它所使用的存储器等等。

对上述任意一种终止情形，我们都希望终止进程能够通知其父进程它是如何终止的。对于exit和_ exit，这是依靠传递给它们的退出状态（ exit status）参数来实现的。在异常终止情况，内核（不是进程本身）产生一个指示其异常终止原因的终止状态（ termination status）。在任意一种情况下，该终止进程的父进程都能用wait或waitpid函数取得其终止状态。

在说明fork函数时，一定是一个父进程生成一个子进程。上面又说明了子进程将其终止状态返回给父进程。但是如果父进程在子进程之前终止，则将如何呢?其回答是对于其父进程已经终止的所有进程，它们的父进程都改变为init进程。我们称这些进程由init进程领养。其操作过程大致是：在一个进程终止时，内核逐个检查所有活动进程，以判断它是否是正要终止的进程的子进程，如果是，则该进程的父进程I D就更改为1 (init进程的I D )。这种处理方法保证了每个进程有一个父进程。

#include <sys/types.h>

#include <sys/wait.h>

pid_t wait(int * statloc) ;

pid_t waitpid(pid_t pid, int *statloc, int options) ;

两个函数返回：若成功则为进程I D，若出错则为-1

这两个函数的区别是：

•在一个子进程终止前， wait 使其调用者阻塞，而waitpid 有一选择项，可使调用者不阻塞。

• waitpid并不等待第一个终止的子进程—它有若干个选择项，可以控制它所等待的进程。

如果一个子进程已经终止，是一个僵死进程，则wait立即返回并取得该子进程的状态，否则wait使其调用者阻塞直到一个子进程终止。如调用者阻塞而且它有多个子进程，则在其一个子进程终止时，wait就立即返回。因为wait返回终止子进程的进程I D，所以它总能了解是哪一个子进程终止了。

这两个函数的参数statloc是一个整型指针。如果statloc不是一个空指针，则终止进程的终止状态就存放在它所指向的单元内。如果不关心终止状态，则可将该参数指定为空指针。

对于waitpid的pid参数的解释与其值有关：

• pid == -1 等待任一子进程。于是在这一功能方面waitpid与wait等效。

• pid > 0 等待其进程I D与pid相等的子进程。

• pid == 0 等待其组I D等于调用进程的组I D的任一子进程。

• pid < -1 等待其组I D等于pid的绝对值的任一子进程。

高级编程清单8-4和8-5说明了两者用法。

4 exec

前面曾提及用fork函数创建子进程后，子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时，该进程完全由新程序代换，而新程序则从其main函数开始执行。因为调用e x e c并不创建新进程，所以前后的进程I D并未改变。exec只是用另一个新程序替换了当前进程的正文、数据、堆和栈段。

有六种不同的exec函数可供使用，它们常常被统称为exec函数。这些exec函数都是UNIX进程控制原语。用fork可以创建新进程，用exec可以执行新的程序。exit函数和两个wait函数处理终止和等待终止。这些是我们需要的基本的进程控制原语。在后面各节中将使用这些原语构造另外一些如popen和system之类的函数。

#include <unistd.h>

int execl(const char *pathname, const char *arg 0, ... /* (char *) 0 */);

int execv(const char*pathname, char *const argv [] );

int execle(const char *pathname, const char *arg 0, .../* (char *)0, char *const envp [] */);

int execve(const char*pathname, char *const argv [], char *const envp [] );

int execlp(const char* filename, const char * arg 0, ... /* (char *) 0 */);

int execvp(const char*filename, char *const argv [] );

六个函数返回：若出错则为- 1，若成功则不返回

这些函数之间的第一个区别是前四个取路径名作为参数，后两个则取文件名作为参数。当指定filename作为参数时：如果filename中包含/，则就将其视为路径名。否则就按PAT H环境变量，在有关目录中搜寻可执行文件。

第二个区别与参数表的传递有关( l表示表( list )，v表示矢量( vector ) )。函数execl、execlp和execle要求将新程序的每个命令行参数都说明为一个单独的参数。这种参数表以空指针结尾。对于另外三个函数(execv, execvp和execve)，则应先构造一个指向各参数的指针数组，然后将该数组地址作为这三个函数的参数。

最后一个区别与向新程序传递环境表相关。以e结尾的两个函数（execle和execve）可以传递一个指向环境字符串指针数组的指针。其他四个函数则使用调用进程中的environ变量为新程序复制现存的环境。

这六个exec函数的参数很难记忆。函数名中的字符会给我们一些帮助。字母p表示该函数取filenamee作为参数，并且用PAT H环境变量寻找可执行文件。字母l表示该函数取一个参数表，它与字母v互斥。v表示该函数取一个arg v[]。最后，字母e表示该函数取envp[] 数组，而不使用当前环境。

注意，在exec前后实际用户ID和实际组ID保持不变，而有效ID是否改变则取决于所执行程序的文件的设置-用户-ID位和设置-组-ID位是否设置。如果新程序的设置-用户-ID位已设置，则有效用户ID变成程序文件所有者的ID，否则有效用户ID不变。对组ID的处理方式与此相同。

在很多UNIX实现中，这六个函数中只有一个execve是内核的系统调用。另外五个只是库函数，它们最终都要调用系统调用。这六个函数之间的关系示于下图中。在这种安排中，库函数execlp 和execvp 使用PATH环境变量查找第一个包含名为filename的可执行文件的路径名前缀。

关于设置用户id的作用，参考高级编程8.11实例。

5 system

在程序中执行一个命令字符串很方便。例如，假定要将时间和日期放到一个文件中，则可调用time得到当前日历时间，接着调用licaltime将日历时间变换为年、月、日、时、分、秒、周日形式，然后调用strftime对上面的结果进行格式化处理，最后将结果写到文件中。但是用下面的system函数则更容易做到这一点。system("date > file");

#include <stdlib.h>

int system(const char * cmd string) ;

如果cmdstring是一个空指针，则仅当命令处理程序可用时， system返回非0值，这一特征可以决定在一个给定的操作系统上是否支持system函数。

高级编程8.13说明了system的用execl以及waitpid实现system的方法，以及在设置用户ID程序中调用system存在的安全隐患。