Linux地址空间

沉着冷静2024

已于 2023-07-22 10:13:34 修改

阅读量183

点赞数 2

分类专栏： Linux 文章标签： linux

于 2023-07-21 22:25:05 首次发布

本文链接：https://blog.csdn.net/dev1cce/article/details/131861232

版权

Linux 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

Linux地址空间

文章目录

- - Linux地址空间

程序地址空间

我们在之前的语言的学习过程中有提到过程序的地址空间，它到底是什么样的呢？

我们来看下面这张图片：

我们通过一段代码来验证一下是不是这样的：

#include <iostream>
#include <cstdio>

int num1 = 10;
int num2;
int main()
{
    printf("已初始化: %p\n", &num1);
    printf("未初始化: %p\n", &num2);
    const char *s = "12345";
    printf("常量区, %p\n", s);
    int *p = new int(10);
    printf("堆区: %p\n", p);
    printf("栈区: %p\n", &p);
    printf("栈区: %p\n", &s);

    return 0;
}

虽然代码很粗糙，但是不难看出和这张图片基本是相符的。

我们来看另一段代码：

#include <iostream>
#include <cstdio>
#include <unistd.h>

int s_val = 100;
int main()
{
    pid_t id = fork();
    if (id > 0)
    {
        int count = 0;
        while (1)
        {
            printf("我是父进程, PID->%d, PPID->%d, val->%d, &val->%p\n", getpid(), getppid(), s_val, &s_val);
            if(count == 2) s_val = 10;
            count++;
            sleep(2);
        }
    }
    else if (id == 0)
    {
        while (1)
        {
            printf("我是子进程, PID->%d, PPID->%d, val->%d, &val->%p\n", getpid(), getppid(), s_val, &s_val);
            sleep(2);
        }
    }
    else
    {
        perror("fork fail");
    }
    return 0;
}

我们用fork创建了一个子进程，在几秒后让子进程修改s_val的值，我们看看父子进程会有什么变化呢?

我们发现在子进程修改了s_val的值后，父进程还是输出s_val原来的值，甚至他们输出的地址还是一样的。这是为什么呢？

按照之前学的来看，同一个物理地址输出的应该是同一个值，但这里又不是相同的值。

其实这就要提出一个虚拟地址的概念了，我们在语言层面上操作的地址都不是物理地址，而是操作系统根据物理地址和页表转化过来的。我们之前也提了，操作系统不会放心给用户这么大的权限的，所以说如果你用语言写一个内存泄露，操作系统真的就会内存泄露吗？这显然是否定的。

看上去输出的同一个地址，本质其实不是相同的。

所以说我们称呼它为程序的地址空间是不够准确的，我们应该称呼它为进程的地址空间。

进程地址空间

进程地址空间本质上是一种内核数据，在Linux系统中由结构体mm_struct实现。

类比之前的那张图片，看看内核中的mm_struct是怎么实现的：

struct mm_struct
{
	unsigned int code_start;
	unsigned int code_end;
	unsigned int init_start;
	unsigned int init_end;
	unsigned int uninit_start;
	unsigned int uninit_end;
	unsigned int heap_start;
	unsigned int heap_end;
	unsigned int stack_start;
	unsigned int stack_end;
	……
}

code : 代码区
init: 初始化数据区
uninit: 未初始化数据区
heap: 堆区
stack: 栈区

操作系统创建进程时创建一个PCB(其中有一个结构体指针指向mm_struct)和mm_struct。