许多朋友对fork和exec调用概念比较模糊,下面我简单描述下这方面的知识。
学过C语言的都知道,Unix下某个进程的内存分成三部分:代码段,堆栈段,数据段。代码段用来存放程序运行的代码,堆栈段用来存放子程序的局部变量,数据段用来存放全局变量。这在perl里也是一样的。
perl的fork调用,跟C的一样,当发生fork调用时,实际上发生如下事:
父进程将代码段,堆栈段,数据段完全复制一份给子进程。也就是说,在子进程运行之初,它拥有父进程的一切变量和句柄。例如,父进程申明了某个hash表,那这个hash表也会被子进程拥有。
然 而,一旦子进程开始运行,它的数据段和堆栈段就在内存里完全和父进程分离开了。也就是说,两个进程间不再共享任何数据。例如前面所说的hash表,虽然子 进程从父进程处继承了这个数据结构,但子进程写往hash里的数据,不会被父进程访问到。在shell里用ps命令,可以看到2个独立运行的进程。通常你 kill掉1个,不会影响另1个的运行。
那么父进程和fork出来的子进程如何通信呢?父进程和子进程间的通信有多种方法,最常见的是信号,另外还有管道,Socket,消息队列等,不在这里详叙。而2个进程间共享数据的办法,可以用线程或共享内存,我对这方面不熟悉。
如 果大概明白了fork,那么exec就容易理解了。一个进程一旦调用exec类函数,它本身就“死亡”了,系统把代码段替换成新的程序的代码,废弃原有的 数据段和堆栈段,并为新程序分配新的数据段与堆栈段,唯一留下的,就是进程号,也就是说,对系统而言,还是同一个进程,不过已经是另一个程序了。
在perl里,调用exec后,原进程就完全消失,由于消失了,它也就不会从新进程接受到任何返回值,除非新进程意外终止,原进程会接受到错误值。
fork 函数 | exec 函数 | |
文件描述符表 文件表 索引节点表 | 子进程复制文件描述符表 共享文件表、索引节点表 | 查看每个文件描述符表中的close_on_exec 标志,若设置了该标志则关闭对应描述符,否则复制 |
实际用户、实际组 | 从父进程继承 | 保持不变 |
有效用户、有效组 | 从父进程继承 | 若执行文件的 set-uid 位设置,则设置成程序文件的用户 ID, 否则保持不变 |
保存的设置 - 用户 -ID 、设置 - 组 -ID | 从父进程继承 | 从上面已经分配的有效用户复制过来,也就是说若执行文件的 set-uid 为设置,则设置成程序文件的用户 ID ,否则复制有效用户。 |
添加组 | 从父进程继承 | 保持不变 |
对话期 ID 、进程组 ID 、控制终端 | 从父进程继承 | 保持不变 |
fsuid 、 fsgid 文件有效用户ID 、组 ID (针对 linux 系统) | 从已经被赋值的有效用户、有效组复制过来 | 从已经被赋值的有效用户、有效组复制过来 |
环境变量 | 从父进程继承,也可以在main(argc,argv[][],env[][]) 指定环境变量 | 保持不变,也可以在execve(path[],argv[][],env[][]) 指定环境变量 |
根目录、当前工作目录、文件创建屏蔽字 | 从父进程继承 | 保持不变 |
资源限制 | 从父进程继承 | 保持不变 |
系统执行时间 用户执行时间 | 清空 | 保持不变 |
阻塞信号集合 | 从父进程继承 | 保持不变 |
挂起信号集合 | 被清除 | 保持不变 |
信号处理方式 | 从父进程继承 | 对于设置了信号捕捉函数的信号的处理方式改为默认处理方式,其他信号的处理方式保持不变 |
使用资源( ??? 还有疑问) | 清空 | 保持不变 |
父进程设置的锁(例如文件锁、互斥锁等) | 不继承 | 保持不变 |