一、fork()
#include <unistd.h>
pid_t fork(void);
//返回:子进程返回0,父进程返回子进程ID,出错为-1
- 功能:fork可用于创建一个子进程
- fork的返回值:fork函数被调用一次,但返回两次
- 成功时:
- 子进程的PID将在父进程中返回
- 而0将在子进程中返回
- 失败时:返回-1:是在父进程中返回,不创建子进程,并且正确设置errno
- 成功时:
创建的子进程与父进程之间的关系
- ①fork函数复制当前进程,在内核进程表中创建一个新的进程表项,子进程是父进程的副本。例如,子进程获得父进程数据空间、堆和栈、标志寄存器的值的副本(缓冲区的数据也会拷贝到子进程,下面有案例介绍)
- ②因为子进程是副本。所以子进程只是拷贝父进程的内容,但是父、子进程并不共享这些存储空间部分
- ③父、子进程共享正文段
子进程继承父进程的其他性质
- 实际用户ID、实际组ID、有效用户ID、有效组ID、添加组ID、进程组ID、对话期I D
- 控制终端、设置-用户-ID标志和设置-组-ID标志、当前工作目录、根目录、文件方式创建屏蔽字、信号屏蔽和排列、对任一打开文件描述符的在执行时关闭标志、环境、连接的共享存储段、资源限制
父、子进程之间的区别
- fork的返回值、进程ID、不同的父进程ID
- 子进程的tms_utime ,tms_stime , tms_cutime, 以及tms_cstime设置为0
- 父进程设置的锁子进程不继承
- 子进程的未处理闹钟被清除。信号位图被清除(原进程设置的信号处理函数不再对新进程起作用)
- 子进程的未处理信号集设置为空集
fork的两种用法
- 一个父进程希望复制自己,使父、子进程同时执行不同的代码段。这在网络服务进程中是常见的——父进程等待委托者的服务请求。当这种请求到达时,父进程调用fork,使子进程处理此请求。父进程则继续等待下一个服务请求
- 一个进程要执行一个不同的程序。这对shell是常见的情况。在这种情况下,子进程在从fork返回后立即调用exec
- 注意:当父、子进程分别从自己的if或else if语句中返回时,都会各自执行main函数的剩余部分
写时复制(copy on write)
- 子进程的代码与父进程完全相同,同时它还会复制父进程的数据(堆数据、栈数据、静态数据)。由于在fork之后经常跟随着exec,所以现在的很多实现并不执行一个父进程数据段、栈和堆的完全副本。作为替代,数据的复制采用的是写时复制(copy-on-write ,COW)技术
- 写时复制是指:即只有在任一进程(父进程或子进程)对数据执行了写操作时,复制才会发生(先是缺页中断,然后操作系统给子进程分配内存并复制父进程的数据)
- 这些区域由父、子进程共享,而且内核将它们的访问权限改变为只读
- 如果父、子进程中的任一试图修改这些区域,则内核只为修改区域的那块内存制作一个副本,通常是虚拟存储系统的一“页”
演示案例
int globvar = 6; char buf[] = "a write to stdout\n"; int main(void) { int var; pid_t pid; var = 88; if (write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1) perror("write error"); printf("before fork\n"); if ((pid = fork()) < 0) { perror("fork error"); } else if (pid == 0) { globvar++; var++; } else { sleep(2); } printf("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar,var); exit(0); }
演示效果1:
- 先打印信息
- 然后打印子进程的pid,再打印父进程的pid(因此父、子进程的执行时随机的,先后不确定。所以程序让父进程sleep3秒,让子进程先执行)
演示效果2:
- 我们让输出信息重定向到一个文件中
- "before fork"打印两次的原因:
- 标准输出如果输出到终端设备,则是行缓冲,所以实验一只打印一次
- 而实验二不是输出到终端设置,则是全缓冲。因为printf还没有打印,子进程创建了,此时缓冲区的数据就会复制一份到子进程中。因此当每个进程终止时,其缓冲区中的内容都被写到文件中
父、子进程文件共享
- fork的一个特性是所有由父进程打开的描述符都被复制到子进程中
- 这种共享文件的方式使父、子进程对同一文件使用了一个文件位移量。因此父、子进程对同一文件描述符操作时会出现混乱
在fork之后处理文件描述符有两种常见的情况:
- 父进程等待子进程完成。在这种情况下,父进程无需对其描述符做任何处理。当子进程终止后,它曾进行过读、写操作的任一共享描述符的文件位移量已做了相应更新
- 父、子进程各自执行不同的程序段。在这种情况下,在fork之后,父、子进程各自关闭它们不需使用的文件描述符,并且不干扰对方使用的文件描述符。这种方法是网络服务进程中经常使用的(例如:父进程接受的已连接套接字传递给子进程进行读写,父进程则关闭这个套接字)
二、vfork()
#include <sys/types.h>
#include <unistd.h>
pid_t vfork(void);
//返回值:与fork相同
vfork的起源
- vfork起源于较早的2.9BSD。有些人认为,该函数是有瑕疵的。事实上,BSD的开发者在4.4BSD中删除了该函数,但4.4BSD派生的所有开放源码BSD版本又将其收回。在SUSv3中,vfork被标记为弃用的接口,在SUSv4中被完全删除。可移植的应用程序不应该使用这个函数
- 功能:vfork用于创建一个新进程,而该新进程的目的是exec一个新程序
- vfork()的特点:
- 不过在子进程调用exec或exit之前,它在父进程的空间中运行。 这种工作方式在某些UNIX的实现中提高了效率
- 但是如果子进程修改数据(除了用于存放vfork返回值的变量)、进行函数调用、或者没有调用exec或exit就返回都可能会带来未知的后果
- 与fork()的不同:
- 重点:fork是复制一份父进程的内容然后运行自己的新开辟的地址空间。而vfork是在父进程的地址空间中运行
- vfork与fork一样都创建一个子进程, 但是它并不将父进程的地址空间完全复制到子进程中,因为子进程会立即调用exec(或exit),于 是也就不会存访该地址空间
- 重点:vfork保证子进程先运行,在它调用exec或exit之后父进 程才可能被调度运行。(如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁)
演示案例
int globvar = 6; int main(void) { int var; pid_t pid; var = 88; printf("before vfork\n"); if ((pid = vfork()) < 0) { perror("vfork error"); } else if (pid == 0) { globvar++; var++; _exit(0); } printf("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar,var); exit(0); }
运行结果:
- 因为vfork创建的子进程在父进程的地址空间中运行,所以vfrok()改变了值,父进程的也变化了