一、fork函数原型
#include <unistd.h> //引用fork()时的头文件
pid_t fork(void);
返回值
pid_t是进程描述符,其实就是int类型,如果fork()函数调用失败,就返回-1.
成功调用fork()函数一次,返回两次——在父进程中返回子进程的pid(非0值),在子进程中返回0.
函数功能
以当前进程作为父进程创建出一个新的子进程,并且将父进程的所有资源拷贝给子进程,这样子进程作为父进程的一个副本存在。父子进程几乎时完全相同的,但也有不同的如父子进程PID不同。
注意
- 当fork成功调用后此时有两个数据相同的父子进程,我们可以通过fork的返回值来判断接下来程序是在执行父进程还是子进程。
id==0:执行子进程
id>0:在父进程中执行
id<0:fork函数调用失败
- fork生成子进程后父子进程谁先运行是不确定的,即fork函数执行完成,父进程和子进程都独立运行。
二、父子进程共享数据的研究
- 全局变量、局部变量
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <unistd.h>
int gdata = 10;
int main()
{
int ldata = 10;
pid_t pid = fork();
if(pid == 0)
{
gdata++;
ldata++;
printf("gdata=%d,ldata=%d\n",gdata,ldata);
printf("&gdata=%x,&ldata=%x\n",&gdata,&ldata);
}
else
{
sleep(2);
printf("gdata=%d,ldata=%d\n",gdata,ldata);
printf("&gdata=%x,&ldata=%x\n",&gdata,&ldata);
}
}
通过结果得知,子进程对全局数据gdata、局部数据ldata进行了修改,但是父进程获取的数据确仍然是初始化的值。所以我们可以得知,在数据类型为全局变量、局部变量(栈区)时,父子进程之间的数据不共享。
- 堆区数据(动态内存)
int main()
{
char *ptr = (char *)malloc(10);//动态申请堆区空间
assert(ptr != NULL);
strcpy(ptr,"hello");
pid_t pid = fork();
assert(-1 != pid);
if(pid == 0)
{
strcpy(ptr,"world");
printf("child:%s\n",ptr);
printf("child:0x%x\n",ptr);
}
else
{
printf("father:%s\n",ptr);
printf("father:0x%x\n",ptr);
}
}
malloc函数仅仅是开辟虚拟空间,真正开辟物理空间是在程序中使用开辟的空间时。当数据类型是动态开辟时,父子进程的数据不共享。
写时拷贝技术:fork以后并不会真正复制空间,只有任意一个进程视图修改的时候,才会将要修改数据的那一页复制出来
fork之后,子进程回拷贝父进程的PCB结构,然后对PCB里面数据做修改。父进程的页表直接拷贝给子进程,父子进程共享所有的数据空间。
当父子进程任意一个进程试图修改数据时,操作系统就会将要修改的数据所在的页直接复制出来。
- 文件:fork之前打开的文件描述符(对于fork之后,父子进程相互独立,单独执行)
//a.txt
helloworld
int main()
{
int fd = open("a.txt",O_RDWR);
assert(fd != -1);
pid_t n = fork();
assert(n != -1);
if(n == 0)
{
char *buff[128] = {0};
read(fd,buff,5);
printf("child:%s\n",buff);
}
else
{
char *buff[128] = {0};
read(fd,buff,5);
printf("father:%s\n",buff);
}
close(fd);
exit(0);
}
对于数据类型为文件时,父子进程之间共享数据,具体而言是共享了读写偏移量。