(入门自用)--Linux--程序地址空间--程序的创建--0907-0913

Gosolo！

已于 2022-09-20 20:14:54 修改

阅读量218

点赞数

分类专栏： Linux 文章标签： c++ 开发语言

于 2022-09-08 09:43:27 首次发布

本文链接：https://blog.csdn.net/qq_68741368/article/details/126758239

版权

Linux 专栏收录该内容

36 篇文章 1 订阅

订阅专栏

程序地址空间

问题引入

#include <stdio.h>
#include <unistd.h>
int g_val=100;
int main()
{
    pid_t id=fork();
    if(id==0)
    {    
        int cnt=0;
        //子进程
        while(1)
        { 
            printf（"child pid:%d,ppid %d,g_val: %d,&g_val: %p\n",
                getpid(),getppid(),g_val.&g_val;）
            sleep(1);   
            cnt++;
            if(cnt==5)
            {
                g_val=200;
            }
                
        }
    }
    else
    {
        while(1)
        { 
            printf（"father pid:%d,ppid %d,g_val: %d,&g_val: %p\n",
                getpid(),getppid(),g_val.&g_val;）
            sleep(1);       
        }

    }


}

结果：发现地址相同而值不同。结论：地址不是真实的物理内存地址，而是虚拟地址（线性地址）。内核中的地址空间，本质将来也一定是一种数据结构。

地址空间分布

命令行参数环境变量

栈

共享区

堆

未初始化数据

初始化数据

正文代码

在Linux环境下发现虚拟地址符合上述空间分布规则。

注意：

堆区的申请不连续，原因是在申请的空间之后会有一些空间被用来记录申请空间的属性。
正文代码中包含了字符常量区。

static变量

static修饰局部变量的本质：将该变量开辟在全局区域。

static的意思就是把局部变量变成全局变量。

地址空间（数据结构）

地址空间是一种内核数据结构，它里面至少要有：各个区域的划分。

stuct addr_room
{
    int code_start;
    int code_end;
    
    int init_start;
    int init_end;

    int uninit_start;
    int uninit_end;

    int heap_start;
    int heap_end;

    int stack_start;
    int stack_end;
    
    //...其他属性

}

程序的地址

程序在编译的时候，形成可执行程序的时候，没有被加载到内存中的时候，程序就已经有地址了。其实可执行程序编译的时候，内部就已经有地址了。

地址空间不仅操作系统内部遵守，编译器也遵守。即在编译时，就已经给我们形成了各个区域。并且和Linux内核中一样的编址方式，给每一个变量，每一行代码都进行了编址。所以在程序编译时，每个字段早已经具有了一个虚拟地址。

为什么要有程序地址空间

更安全

地址空间和页表是操作系统创建并维护的。所以使用地址空间和页表（单位为页框。页和页框之间通过MMU调度）进行映射，也一定要在操作系统的监管之下。也便保护了物理内存中的所有的合法数据，包括各个进程，以及内核的相关有效数据。

解耦合

因为有地址空间和页表的存在，未来的数据可以加载到物理内存的任意位置。所以内存管理模块（物理内存的分配）和进程管理模块就完成了解耦合。

如果我申请了物理空间，但是如果我不立马使用，这就构成了空间的浪费。采用延时分配的策略，来提高整机的效率。所以我们在使用malloc和new申请空间的时候，本质上是在虚拟地址空间上申请的。因为有地址空间的存在，物理内存可以一个字节都不分配。而当真正进行对物理地址空间访问的时候，才会执行内存的相关管理算法，申请内存，构建页表映射关系，再进行内存的访问。这个过程由操作系统自动完成，用户，进程完全不知道。

内存分布有序化

因为理论上数据可以在物理内存的任意位置加载，所以物理内存中的几乎所有的数据和代码在内存中是乱序的。但是因为有页表存在，在进程的视角所有的内存分布都可以是有序的。

进程的独立性

地址空间是操作系统给进程画的大饼，因为有地址空间的存在，每一个进程都认为自己拥有4GB空间（32位）。进程要访问的物理内存中的数据和代码，可能目前并没有在物理内存中。同样的，也可以让不同的进程一映射到不同的物理内存。因为有地址空间的存在，进而可以通过页表映射到不同的区域来实现进程的独立性。每一个进程都不知道，也不需要知道其他进程的存在。

什么是挂起

加载本质就是创建进程。进程本质上就是对应的代码和数据（从磁盘中来）+内核数据结构（操作系统）。而加载并不是必须非得立马把所有的程序的代码和数据加载到内存里，并创建内核数据结构建立映射关系。在极端情况下，程序可能只有内核结构被创建出来了（即pcb和页表），并没有被分配物理内存。此时该程序处于新建状态。由此可以发现，理论上可以实现对程序的分批加载（唤入），那也就可以分批唤出。当一个进程短时间不会再被执行了，比如进入了阻塞状态，进程的数据和代码被唤出了，就叫做挂起了。