通过fork创建的子进程会拷贝父进程的代码段、数据段、静态数据段、堆、栈、IO缓冲区

本文详细探讨了Linux中的fork系统调用以及写时复制(Copy-On-Write, COW)技术。在fork时,子进程继承了父进程的虚拟地址空间,但物理地址在写操作前保持共享。COW机制提高了效率,仅在需要时才复制页面。子进程先调度以优化exec使用,避免不必要的内存拷贝。通过这个机制,父子进程可以拥有相同的虚拟地址,但物理地址可能不同,确保了各自独立性。
摘要由CSDN通过智能技术生成

通过fork创建的子进程会拷贝父进程的代码段、数据段、静态数据段、堆、栈、IO缓冲区

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

void func()
{
    printf("我是函数%s\n",__func__);
}
int num = 0;
int main()
{
    static int num_s;
    int* p = malloc(4);
    pid_t pid = fork();
    printf("haha\n");
    if(0 == pid)
    {   
        func();
        *p = 1234;
        num = 1234;
        num_s = 1234;
        printf("我是子进程%u %p %p %p\n",pid,p,&num,&num_s);
    }   
    else
    {   
        func();
        *p = 4567;
        num = 4567;
        num_s = 4567;
        printf("我是父进程%u %p %p %p\n",pid,p,&num,&num_s);
    }   
}

从下图的结果中也可以看出子进程中的变量地址和父进程中的一样。
在这里插入图片描述
这里就涉及到物理地址和虚拟地址(或称逻辑地址)的概念。

从逻辑地址到物理地址的映射称为地址重定向。分为:

静态重定向–在程序装入主存时已经完成了逻辑地址到物理地址和变换,在程序执行期间不会再发生改变。

动态重定向–程序执行期间完成,其实现依赖于硬件地址变换机构,如基址寄存器。

虚拟地址:CPU所生成的地址。CPU产生的逻辑地址被分为 :p (页号) 它包含每个页在物理内存中的基址,用来作为页表的索引;d (页偏移),同基址相结合,用来确定送入内存设备的物理内存地址。

物理地址:内存单元所看到的地址。
用户程序看不见真正的物理地址。用户只生成逻辑地址,且认为进程的地址空间为0到max。物理地址范围从R+0到R+max,R为基地址,地址映射-将程序地址空间中使用的逻辑地址变换成内存中的物理地址的过程。由内存管理单元(MMU)来完成。

fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,linux中引入了“写时复制“技术,也就是只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。在fork之后exec之前两个进程用的是相同的物理空间(内存区),子进程的代码段、数据段、堆栈都是指向父进程的物理空间,也就是说,两者的虚拟空间不同,但其对应的物理空间是同一个。当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间,如果不是因为exec,内核会给子进程的数据段、堆栈段分配相应的物理空间(至此两者有各自的进程空间,互不影响),而代码段继续共享父进程的物理空间(两者的代码完全相同)。而如果是因为exec,由于两者执行的代码不同,子进程的代码段也会分配单独的物理空间。

fork时子进程获得父进程代码和数据段、共享库、堆和栈的复制,所以变量的地址(当然是虚拟地址)也是一样的。

每个进程都有自己的虚拟地址空间,不同进程的相同的虚拟地址显然可以对应不同的物理地址。因此地址相同(虚拟地址)而值不同没什么奇怪。
具体过程是这样的:
fork子进程完全复制父进程的栈空间,也复制了页表,但没有复制物理页面,所以这时虚拟地址相同,物理地址也相同,但是会把父子共享的页面标记为“只读”(类似mmap的private的方式),如果父子进程一直对这个页面是同一个页面,知道其中任何一个进程要对共享的页面“写操作”,这时内核会复制一个物理页面给这个进程使用,同时修改页表。而把原来的只读页面标记为“可写”,留给另外一个进程使用。

这就是所谓的“写时复制”。正因为fork采用了这种写时复制的机制,所以fork出来子进程之后,父子进程哪个先调度呢?内核一般会先调度子进程,因为很多情况下子进程是要马上执行exec,会清空栈、堆。。这些和父进程共享的空间,加载新的代码段。。。,这就避免了“写时复制”拷贝共享页面的机会。如果父进程先调度很可能写共享页面,会产生“写时复制”的无用功。所以,一般是子进程先调度滴。

假定父进程malloc的指针指向0x12345678, fork 后,子进程中的指针也是指向0x12345678,但是这两个地址都是虚拟内存地址 (virtual memory),经过内存地址转换后所对应的 物理地址是不一样的。所以两个进城中的这两个地址相互之间没有任何关系。

(注1:在理解时,你可以认为fork后,这两个相同的虚拟地址指向的是不同的物理地址,这样方便理解父子进程之间的独立性)
(注2:但实际上,Linux为了提高 fork 的效率,采用了 copy-on-write 技术,fork后,这两个虚拟地址实际上指向相同的物理地址(内存页),只有任何一个进程试图修改这个虚拟地址里的内容前,两个虚拟地址才会指向不同的物理地址(新的物理地址的内容从原物理地址中复制得到))

### 回答1: 在 Linux 中,子进程拷贝进程缓冲区。在进程创建时,内核子进程分配一个新的地址空间,该地址空间是进程地址空间的一个完整拷贝。这意味着,子进程拷贝进程的所有内存映射,包括缓冲区。 不过,在某些情况下,可以使用写时拷贝(copy-on-write,简称 COW)技术来共享缓冲区数据。COW 是一种内存管理技术,它可以让多个进程共享同一内存,但是只有在某个进程想要修改该内存时,才真正地为该进程拷贝一份内存。这样就可以节省内存,因为多个进程可以共享同一内存,而不需要为每个进程都分配一份内存。 COW 技术主要应用于内存映射文件(mmap)和共享内存(shmget)等机制中。当使用这些机制创建内存映射时,可以设置内存保护标志,来启用 COW 技术。 ### 回答2: 在Linux中,子进程通过写时拷贝机制来处理进程缓冲区。写时拷贝是一种优化技术,它通过在fork()系统调用时,暂时共享进程的物理内存页,只有在子进程中实际发生写入操作时才进行复制。 具体来说,当进程调用fork()创建子进程时,子进程进程共享相同的虚拟地址空间。这意味着子进程可以访问和使用进程缓冲区。但是,当子进程进行写入操作时,Linux内核将需要被写入的那块内存页复制一份为子进程独享的内存页。这样,原先进程缓冲区内存页不被修改,而子进程将有自己的独立副本。 这种写时拷贝机制的好处是节省内存空间,因为在fork之后,如果进程子进程都不进行写入操作,它们将共享相同的内存页,不复制数据。只有在需要写入时才发生复制。 总的来说,Linux子进程在使用进程缓冲区时,通过写时拷贝机制来共享数据,只有在写入操作发生时才复制数据。这种机制有效地提高了系统的效率和性能。 ### 回答3: 在Linux中,子进程直接拷贝进程缓冲区。相反,它们使用写时拷贝(copy-on-write)的方法来共享缓冲区数据。 当进程创建子进程时,操作系统子进程创建一个与进程完全相同的地址空间和相关资源。这包括代码数据等。进程缓冲区数据子进程的地址空间中被复制一份。 然而,并不是立即拷贝整个缓冲区数据。而是使用写时拷贝技术来延迟实际的拷贝操作。当子进程试图修改缓冲区数据时,操作系统在底层执行实际的数据拷贝操作,将指定的数据块从进程的地址空间复制子进程的地址空间中。这样,进程子进程仍然共享相同的物理内存页,直到有一个进程试图修改其中的数据。 这种写时拷贝的方法可以显著提高效率,尤其是在创建子进程后很少或不进行修改缓冲区数据的情况下。因为在这种情况下,实际的数据拷贝操作是不必要的,节省了时间和内存资源。 总之,Linux中的子进程使用写时拷贝来共享进程缓冲区数据。只有在修改缓冲区数据时才进行实际的数据拷贝操作。这种机制有效地提高了系统的性能和资源利用率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值