详解 Linux 系统下的进程（下）

core dump（核心转储）：当进程因为接收到带有core dump属性的信号而终止时，操作系统会将进程在内存中的状态（包括寄存器值、内存内容等）保存到磁盘上的一个文件中，这个文件通常命名为core.PID，其中PID是进程的进程ID。Core dump文件对于后续的调试工作非常有用，因为它提供了进程崩溃时的详细内存映像。

返回值：若pid_t > 0 则返回等待进程的pid；若pid_t < 0 则返回失败。

② waitpid

pid_t waitpid (pid_t pid, int* status, int options);

第一个参数 pid_t pid ：可以指定进程的pid去等待，亦可将pid设为-1，即等待任意进程。

第二个参数 int* status ：输出型参数，即传进去的值不重要，传出来的值重要！

第三个参数：int options：为0，表示父进程等待的时候，以阻塞状态等待；为 WNOHANG，表示父进程等待的时候，以非阻塞状态等待。

若阻塞等待，父进程在哪里等子进程？--- 父进程在子进程的等待队列里排队.

阻塞状态 --- 阻塞式调用 --- wait/waited --- 子进程不退出，wait不返回 --- 等待的过程中，父进程啥也做不了！！

非阻塞状态 --- wait/waited不阻塞，而是立即返回 --- 轮询 + 非阻塞方案 --- 可以顺便做一些占据时间并不多的事情

返回值：若pid_t > 0 则返回等待进程的pid 若pid_t < 0 则返回失败

二.进程替换

我们所创建的所有子进程执行的代码，都是父进程的一部分，那么，如果我们想让子进程执行新的程序（代码和数据不再与父进程有任何关联）呢？？

1.单进程版的程序替换

Linux 命令行指令也是一个个进程（内建命令除外），所以我们在代码中，用特殊的函数去调用执行 xshell 命令中的命令（进程），这一过程，本质就是程序替换.

execl

int execl(const char* path, const char* arg, . . .);

第一个参数 path：表示我们要替换的目标程序的路径.

第二个参数 const char* arg：表示目标程序的执行方法.

注意：最终必须以NULL结尾，表示参数传递完毕！！

如：execl("/usr/bin/ls","ls","-a","-l",NULL);

当代码执行到该函数时，本进程的所有数据和代码全都会被替换成目标进程的代码和数据，即使目标进程的代码执行完毕，原先进程的后续代码也将不再执行。

程序替换的函数的调用，调用失败有返回值，调用成功没有返回值！！

示例：

2.理解和掌握程序替的原理

a.单进程的程序替换原理

当原程序代码执行到excel函数接口时，OS会直接将磁盘中目标程序的代码和数据会覆盖原进程映射到物理内存上的代码和数据，并让CPU从“新加载到内存的代码的main函数”开始执行，这期间并不会创建新的PCB和程序地址空间等资源，exec系列的函数调用接口起到的仅仅是“加载器”的作用！

b.多进程程序替换原理

由于父子进程在物理内存上共享代码和数据，所以在磁盘上目标程序的代码和数据覆盖原进程（调用excel函数的父或子进程）在物理内存上的代码和数据前，OS 会发生写时拷贝，即在物理内存上重新拷贝一份代码和数据区，用存放于目标程序的代码和数据。

程序替换并不会创建新的进程，而是让目标进程占用原进程的资源，在原进程资源的基础上运行！

与父子进程间写时拷贝的区别

父子进程间的写时拷贝仅仅拷贝数据区，不会拷贝代码区，父子进程共用代码。而多进程的程序替换既拷贝数据区，也拷贝代码区，以免目标程序的代码将代码区覆盖，影响到第三进程的运行。

子进程怎么知道，新的程序的代码的起始位置在哪？

Linux系统形成的可执行程序是有格式的，是ELF格式，ELF格式中有表头，其中存放进程程序地址空间上各区的入口地址，其中就包括代码段的入口地址（Entry）。

为啥无论是单进程还是多进程 execl() 函数后面的代码都不跑了？

当eip寄存器走到 execl() 函数时，原进程映射到物理内存上的代码和数据都会被目标进程的代码和数据覆盖，并且使eip从目标进程的entry（可执行程序代码段的入口地址）开始执行目标进程的代码，而原进程execl()函数后的代码也就不复存在了。

3.了解程序替换的各函数接口

函数名中带'l'（list）这个字母的，都意味着：该函数的参数是可变参数.

函数名中带'p'（PATH）这个字母的，都意味着：OS会去环境变量向量表中寻找目标程序，所以我们不用再手写程序的路径，直接告诉OS目标程序的程序名即可.

函数名中带'v'（vector）这个字母的，都意味着：参数要以“数组”的形式传递.

a. execlp

① execlp(const char* filename, const char* arg, . . . );

filename：是要执行的程序的程序名.

arg：对目标程序的操作方法.

如：execlp( "ls", "ls","-a","-l", NULL);

b. execle

② execle(const char* path, const char* arg, . . . ,char* const envp[ ]);

path：是要执行的程序的路径.

envp[ ] 是一个指向以null结尾的字符串数组的指针，是给新进程传递的环境变量表！

如：char* const envp[ ]={ "PATH=/bin:/usr/bin", "TZ=UTC", NULL };

execle("/usr/bin/ls", "ls","-a","-l", NULL, envp);

c. execv

execv(const char* path, char* const argv[ ]);

argv 就是将对目标程序的操作，放在一个数组中.

如：char* const argv[ ]={ "ls", "-a", "-l", NULL };

execv( "/usr/bin/ls", argv );

d. execvp

execvp(const char* filename, char* const argv[ ]);

filename：要执行的程序文件的名称。

注意这里只需要文件名，不需要完整路径，因为 execvp会在环境变量指定的目录中查找该程序.

argv：就是将对目标程序的操作，放在一个数组中.

如：char* const argv[ ]={ "ls", "-a", "-l", NULL };

execv( "ls", argv );

程序替换成功后，eip指针指向“目标进程的main函数”使CPU从头开始执行目标进程，而目标进程的main函数中的“命令行参数”是由exec系列函数接口在“加载”目标进程时，传递的参数！！

用excel调用另一个手写的可执行程序

4.xshell 父子进程架构和进程替换机制

当我们启动 xshell 并连接到远端服务器后，我们可以在 xshell 的命令行输入相关指令，此时，我们所在的进程是 bash 进程.

我们输入的命令会由 xshell 发送到远端服务器，在bash进程下进行解析和执行，如果我们执行的命令不是内建命令，bash 进程就会调用 fork() 创建子进程，并在子进程中调用 exec*系列的进程替换接口，由子进程执行完相关代码，并将执行结果交给 bash，而后由 bash 将最终结果交付给我们。

1.什么命令行？？ ---一个进程打印出来的一串字符串，包括用户名、主机名、当前路径等信息

2.bash内的命令执行的底层原理？？---fork出来的子进程 + exec系列函数 + wait等待

3.环境变量是如给传递给子进程或“替换进程”的？？--- 通过exec系列函数传参、地址空间的继承（父子进程）

4.什么是内建命令？？---本质是shell内部的一个函数，执行内建命令就是调用shell内部的一个函数

Linux 的命令分类：

① 常规命令，bash fork()创建子进程，让子进程去执行

② 内建命令，bash自己执行，类似于bash调用自己的某个函数去执行