APUE——Chapter 7、8：进程环境和进程控制

最新推荐文章于 2021-04-04 21:31:48 发布

The_Hungry_Brain

最新推荐文章于 2021-04-04 21:31:48 发布

阅读量408

点赞数

分类专栏： APUE 读书笔记文章标签：进程

本文链接：https://blog.csdn.net/u010129119/article/details/52797729

版权

读书笔记同时被 2 个专栏收录

40 篇文章 0 订阅

订阅专栏

APUE

7 篇文章 0 订阅

订阅专栏

Chapter 7：进程环境

当内核执行C程序时，在调用main前先调用一个特殊的启动例程。可执行程序文件将此启动例程指定为程序的起始地址。启动例程从内核取得命令行参数和环境变量值，然后为按上诉方式调用main函数做好安排。

进程终止

8种方式使进程终止，

–> 5种正常终止：
（1）从main返回。
（2）调用exit。
（3）调用_exit或_Exit。
（4）最后一个线程从其启动例程返回。
（5）最后一个线程调用pthread_exit。

–> 3种异常终止：
（6）调用abort。
（7）接到一个信号并终止。
（8）最后一个线程对取消请求做出响应。

#include <stdlib.h>
void exit(int status);
void _Exit(int status);

#include <unistd.h>
void _exit(int status);

_exit和_Exit立即进入内核；
exit则先执行一些清理处理（包括调用执行各终止处理程序，关闭所有标准I/O流等），然后进入内核。

按照ISO C的规定，一个进程可以登记多达32个函数，这些函数将由exit自动调用。这些函数被称为终止处理程序（exit handler），并调用atexit函数来登记这些函数。

#include <stdlib.h>

int atexit(void (*func)(void));
                                        /* 返回值：若成功则返回0，若出错则返回非0值 */

exit调用这些函数的顺序与登记顺序相反。同一个函数若被登记多次，则会被调用多次。

这里写图片描述

内核使程序执行的唯一方法是调用一个exec函数。进程自愿终止的唯一方法是显式或隐式地（通过调用exit）调用_exit或_Exit。进程也可非自愿地由一个信号使其终止。

环境表

每个程序都会接收到一张环境表。环境表也是一个字符指针数组，其中每个指针包含一个以null结束的C字符串的地址。

extern char **environ;

这里写图片描述

通常用getenv和putenv函数来访问特定的环境变量，如果要查看整个环境，则必须使用environ指针。

C程序的存储空间布局

组成：

1）正文段（text）。CPU执行的机器指令部分。
2）初始化数据段（data）。
3）非初始化数据段（bss，block started by symbol 由符号开始的块）。
4）栈。自动变量以及每次函数调用时所需保存的信息都存放在此段中。每次调用函数时，其返回地址以及调用者的环境信息都存放在栈中。最近被调用的函数在栈上为其自动和临时变量分配存储空间。
5）堆。通常在堆中进行动态存储分配。

这里写图片描述

非初始化数据段的内容并不存放在磁盘上的程序文件中。其原因是：内核在程序开始运行前将它们都设置为0。
需要存在程序文件中的段只有正文段和初始化数据段。

存储器分配

#include <stdlib.h>

void *malloc(size_t size);
void *calloc(size_t nobj, size_t size);
void *realloc(void *ptr, size_t newsize);
                                        /* 返回值：若成功则返回非空指针，若出错则返回NULL */

void free(void *ptr);

malloc，分配指定字节数的存储区。初始值不确定。
calloc，为指定数量、指定长度的对象分配存储空间。初始化为0。
realloc，更改以前分配区的长度。

虽然sbrk可以扩充或缩小进程的存储空间，但大多数malloc和free的实现都不减小进程的存储空间。释放的空间可供以后再分配，但通常将它们保持在malloc池中而不返回给内核。

注意：大多是实现所分配的存储空间比所要求的要稍微大一些，额外的空间用来记录管理信息——分配块的长度、指向下一个分配块的指针等等。

致命的错误：1、释放一个已经释放的块。2、调用free时所用的指针不是三个alloc函数的返回值。

环境变量

#include <stdlib.h>

char *getenv(const char *name);
                                    /* 返回值：指向与name关联的value指针，若未找到则返回NULL */

int putenv(char *str);
                                    /* 返回值：若成功则返回0，若出错则返回非0值 */

int setenv(const char *name, const char *value, int rewrite);
int unsetenv(const char *name);
                                    /* 返回值：若成功则返回0，若出错则返回-1 */

setjmp和longjmp函数

#include <setjmp.h>

int setjmp(jmp_buf env);
                                    /* 返回值：若直接调用则返回0，若从longjmp调用返回则返回非0值 */

void longjmp(jmp_buf env, int val);

jmp_buf用来存放在调用longjmp时能用来恢复栈状态的所有信息。

getrlimit和setrlimit函数

#include <sys/resource.h>

int getrlimit(int resource, struct rlimit *rlptr);

int setrlimit(int resource, const struct rlimit *rlptr);

进程的资源限制通常是在系统初始化由进程0建立的。

struct rlimit {
    rlim_t    rlim_cur;
    rlim_t    rlim_max;
};

这里写图片描述

普通进程只能不可逆地降低它的硬限制（且不能小于软限制）。超级用户进程或具有CAP_SYS_RESOURCE能力的进程可以随意改变它的两个限制值。

　　RLIM_INFINITY值表示在一个资源上没有使用限制。在某些系统实现上，rlim_t是8字节无符号整数，而RLIM_INFINITY就是rlim_t类型的最大值。

　　resource参数的常用值：

　　RLIMIT_AS：进程虚拟内存（地址空间，Address Space）的最大字节长度。该限制会影响brk、mmap和mremap等。

　　RLIMIT_CORE：core文件的最大字节长度。超出这个大小的core文件会被截短。指定0则表示不产生core文件。

　　RLIMIT_CPU：CPU时间的使用限制（秒）。进程达到软限制时，会收到一个SIGXCPU信号（默认会终止进程。但进程可以捕获该信号）。如果进程继续消耗CPU时间，它会每秒收到一个SIGXCPU信号，直到达到硬限制，并接收到SIGKILL信号（不同的实现在此处可能会有差别）。

　　RLIMIT_DATA：进程数据段（初始化数据节、未初始化数据节和堆）的最大字节长度。该限制会影响brk和sbrk等。

　　RLIMIT_FSIZE：进程所能创建的文件的最大字节长度。

　　RLIMIT_LOCKS：进程可创建的flock锁和fcntl租借锁的总数（租借锁是Linux特有的：fcntl可通过F_SETLEASE命令对文件加读或写的租借锁。当另一个进程尝试打开或截短该文件而产生冲突时，内核会通过信号通知持有租借锁的进程。后者应当对此作出响应，如flush缓冲区或移除租借锁等）。

　　RLIMIT_MEMLOCK：进程使用mlock能够锁定在RAM中的最大字节长度（防止被换出到交换分区。内存的锁定和解锁以页为单位）。该限制会影响mlock、mlockall和mmap等。

　　RLIMIT_MSGQUEUE：调用进程的实际用户所能分配的Posix消息队列的最大字节长度。

　　RLIMIT_NOFILE：进程所能打开（如使用open/pipe/socket）的文件描述符的最大值加1。注意，进程间的文件描述符是独立的。超出该限制会抛出EMFILE错误。

　　RLIMIT_NPROC：调用进程的实际用户所能创建进程（在Linux上，更准确的说法是线程）的最大数目。超出该限制时，fork会失败并抛出EAGAIN错误。

　　RLIMIT_STACK：进程的栈的最大字节长度。超出该限制会收到SIGSEGV信号。

Chapter 8：进程控制

8.1 进程标识符

//:
每个进程都有一个非负整型表示的唯一进程ID。唯一性。进程ID可以重用。当一个进程终止后，其进程ID就可以再次使用了。

ID为 0 的进程通常是调度进程，称为交换进程（swapper）。该进程是内核的一部分，它并不执行任何磁盘上的程序，因此也被称为系统进程。

ID为 1 的进程通常是init进程，在自举过程结束时由内核调用。它是一个普通的用户进程。

#include <unistd.h>

pid_t getpid(void);
                                    /* 返回值：调用进程的进程ID */

pid_t getppid(void);
                                    /* 返回值：调用进程的父进程ID */

uid_t getuid(void);
                                    /* 返回值：调用进程的实际用户ID */

uid_t geteuid(void);
                                    /* 返回值：调用进程的有效用户ID */

gid_t getgid(void);
                                    /* 返回值：调用进程的实际组ID */

gid_t getegid(void);
                                    /* 返回值：调用进程的有效组ID */

8.2 fork函数

#include <unistd.h>

pid_t fork(void);
                                    /* 返回值：子进程中返回0，父进程中返回子进程ID，出错返回-1 */

将子进程ID返回给父进程的理由是：因为一个进程的子进程可以有多个，并且没有一个函数使一个进程可以获得其所有子进程的进程ID。

子进程中返回0的理由：一个进程只会有一个父进程，所以子进程总是可以调用getppid以获得其父进程的进程ID。

子进程是父进程的副本。子进程获得父进程数据空间、堆和栈的副本。父、子进程并不共享这些存储空间部分。父、子进程共享正文段。

fork的一个特性是父进程的所有打开文件描述符都被复制到子进程中。父、子进程的每个相同的打开描述符共享一个文件表项。

这里写图片描述

除了打开文件之外，父进程有很多其他属性也由子进程继承，包括：

实际用户ID、实际组ID、有效用户ID、有效组ID。
附加组ID。
进程组ID。
会话ID。
控制终端。
设置用户ID标志和设置组ID标志。
当前工作目录。
根目录。
文件模式创建屏蔽字。
信号屏蔽和安排。
针对任一打开文件描述符的在执行时关闭（close-on-exec）标志。
环境。
连接的共享存储段。
存储映射。
资源限制。

父、子进程之间的区别是：

fork的返回值。
进程ID不同。
两个进程具有不同的父进程ID。
子进程的tms_utime、tms_stime、tms_cutime、tms_ustime均被设置为0。
父进程设置的文件锁不会被子进程继承。
子进程的未处理的闹钟（alarm）被清除。
子进程的未处理信号集设置为空集。

fork失败的两个主要原因是：

系统中已经有了太多的进程。
该实际用户ID的进程总数超过了系统限制。

fork有两种用法：

一个父进程希望复制自己，使父、子进程同时执行不同的代码段。例如：网络服务进程。
一个进程要执行一个不同的程序。例如：shell，子进程从fork返回后立即执行exec。

8.3 vfork函数

vfork用于创建一个新进程，而该新进程的目的是exec一个新程序。

vfork和fork一样创建一个子进程，但是它并不将父进程的地址空间完全复制到子进程中，因为子进程会立即调用exec，于是也就不会存访问该地址空间。相反，在子进程调用exec或exit之前，它在父进程的空间中运行。

vfork和fork之间的另一个区别是：vfork保证子进程先运行，在它调用exec或exit之后，父进程才可能被调度运行。（若子进程依赖父进程的进一步动作，可能死锁）

8.4 exit函数

进程的5种正常终止方式：

在main函数内执行return语句。等效于exit。
调用exit函数。
调用_exit或_Exit函数。
进程的最后一个线程在其启动例程中执行返回语句。然后该进程以终止状态0返回。
进程的最后一个线程调用pthread_exit函数。

进程的3种异常终止方式：

调用abort。
当进程接收到某些信号时。
最后一个线程对“取消”（cancellation）请求做出响应。

不管进程如何终止，最后都会执行内核中的同一段代码。这段代码为相应进程关闭所有打开描述符，释放它所使用的存储器等。

一个已经终止、但其父进程尚未对其进程善后处理（获取终止子进程的有关信息，释放它仍占用的资源）的进程被称为僵死进程（zombie）。ps(1)命令中状态为Z。

8.5 wait和waitpid函数

当一个进程正常或异常终止时，内核就向其父进程发送SIGCHLD信号。

#include <sys/wait.h>

pid_t wait(int *statloc);
pid_t waitpid(pid_t pid, int *statloc, int options);
                            /* 两个函数返回值：若成功则返回进程ID，0，若出错则返回-1 */

区别：

在一个子进程终止前，wait使其调用者阻塞，而waitpid有一个选项，可使调用者不阻塞。
waitpid并不等待在其调用之后的第一个终止子进程，它有若干个选项，可以控制它所等待的进程。

statloc获取终止状态status。

这里写图片描述

waitpid：

对于waitpid函数中的pid参数：

pid == -1    等待任一子进程。
pid > 0      等待其进程ID与pid相等的子进程。
pid == 0     等待其组ID等于调用进程组ID的任一子进程。
pid < -1     等待其组ID等于pid绝对值的任一子进程。

options可以是0，或者以下按位“或”
这里写图片描述

waitpid提供了wait函数没有提供的三个功能：
（1）waitpid可等待一个特定的进程。
（2）waitpid提供了一个wait的非阻塞版本。
（3）waitpid支持作业控制。

8.6 waitid函数

取进程终止状态。

#include <sys/wait.h>

int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options);
                            /* 若成功则返回0，若出错则返回-1 */

waitid允许一个进程指定要等待的子进程。

这里写图片描述

8.7 wait3和wait4函数

#include <sys/types.h>
#include <sys/wait.h>
#include <sys/time.h>
#include <sys/resource.h>

pid_t wait3(int *statloc, int options, struct rusage *rusage);
pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage);
                        /* 若成功则返回进程ID，若出错则返回-1 */

参数rusage：
该参数要求内核返回由终止进程及其所有子进程使用的资源汇总。

资源统计信息包括：用户CPU时间总量、系统CPU时间总量、页面出错次数、接收到信号的次数等。

这里写图片描述

8.8 exec函数

当进程调用一种exec函数时，该进程执行的程序完全替换为新程序，而新程序则从main函数开始执行。因为调用exec并不创建新进程，所以前后的进程ID并未改变。exec只是用一个全新的程序替换了当前进程的正文、数据、堆和栈段。

#include <unistd.h>

int execl(const char *pathname, const char *arg0, .../* (char *)0 */);

int execv(const char *pathname, char *const argv[]);

int execle(const char *pathname, const char *arg0, .../* (char *)0, char *const envp[] */);

int execve(const char *pathname, char *const argv[], char *const envp[]);

int execlp(const char *filename, const char *arg0, .../* (char *)0 */);

int execvp(const char *filename, char *const argv[]);

                        /* 6个函数返回值：若出错则返回-1，若成功则不返回值 */

8.9 更改用户ID和组ID

#include <unistd.h>

int setuid(uid_t uid);
int setgid(gid_t gid);

8.10 解释器文件

8.11 system函数

#include <stdlib.h>

int system(const char *cmdstring);

system在实现中，调用了fork、exec和waitpid。

8.12 进程会计

一个选项用于进程会计（process accounting）处理。启用该选项后，每当进程结束时，内核就会写一个会计记录。典型的会计记录包含总量较小的二进制数据，一般包括命令、所使用的CPU时间总量、用户ID和组ID、启动时间。

函数acct启用和禁用进程会计。 accton(8)命令使用这一函数。

会计记录结构定义在头文件

#include <sys/acct.h>

typedef u_short comp_t;

struct acct {
    char ac_flag;    /* 记账标记 */
    char ac_stat;    /* termination status */

    uid_t ac_uid; /* 记账用户 ID */
    gid_t ac_gid; /* 记账组 ID */
    dev_t ac_tty; /* 控制终端 */
    time_t ac_btime; /* 进程创建时间(从开机起的秒数) */
    comp_t ac_utime; /* 用户 CPU 时间 */
    comp_t ac_stime; /* 系统 CPU 时间 */
    comp_t ac_etime; /* 流失的时间 */
    comp_t ac_mem; /* 平均内存用量 (kB) */
    comp_t ac_io; /* Characters transferred (未使用) */
    comp_t ac_rw; /* 读写的块 (未使用) */
    char ac_comm[8];   /* 命令名 (执行文件名；以0结尾) */
};

8.13 用户标识

获取登录名。

#include <unistd.h>

char *getlogin(void);

8.10 进程时间

#include <sys/times.h>

clock_t times(struct tms *buf);

                /* 返回值：若成功则返回流逝的墙上时钟时间（单位：时钟滴答数），若出错则返回-1 */

struct tms {
    clock_t    tms_utime;    /* user CPU time */
    clock_t    tms_stime;    /* system CPU time */
    clock_t    tms_cutime;   /* user CPU time, terminated children */
    clock_t    tms_cstime;   /* system CPU time, terminated children */
}

我们可以测量三种时间：墙上时钟时间、用户CPU时间、系统CPU时间。

times函数返回墙上时钟时间，此值是相对于过去的某一时刻测量的。调用两次，计算差值，就是墙上时钟时间。

The_Hungry_Brain

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
APUE——Chapter 7、8：进程环境和进程控制

当内核执行C程序时，在调用main前先调用一个特殊的启动例程。可执行程序文件将此启动例程指定为程序的起始地址。启动例程从内核取得命令行参数和环境变量值，然后为按上诉方式调用main函数做好安排。
复制链接

扫一扫

专栏目录