【Linux】进程地址空间

蒋灵瑜

已于 2023-08-30 20:23:40 修改

阅读量1.4k

点赞数 30

分类专栏： Linux系统编程文章标签： linux 进程

于 2022-11-18 22:45:37 首次发布

本文链接：https://blog.csdn.net/gfdxx/article/details/127930915

版权

Linux系统编程专栏收录该内容

21 篇文章 11 订阅

订阅专栏

需要云服务器等云产品来学习Linux的同学可以移步/-->腾讯云<--/-->阿里云<--/-->华为云<--/官网，轻量型云服务器低至112元/年，新用户首次下单享超低折扣。

四、为什么要通过虚拟地址映射的方式访问物理地址

一、虚拟地址

先看一段父子进程共存的程序，由子进程对全局变量grobal_val进行修改：

#include <stdio.h>
#include <unistd.h>
int grobal_val=10;
int main()
{
    pid_t id=fork();
    if(id==0)
    {
        int cnt=0;
        while(1)
        {
            printf("子进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
            sleep(1);
            ++cnt;
            if(cnt==10)
            {
                grobal_val=200;
                printf("子进程已更改全局变量grobal_val\n");
            }
        }
    }
    else if(id>0)
    {
        while(1)
        {
            printf("父进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
            sleep(1);
        }
    }
    else 
    {
        printf("fork error\n");
        return 1;
    }
    return 0;
}

父子进程谁先执行不确定，由系统进行调度。

当子进程将全局变量grobal_val由10改为200，我们可以看到，父子进程的grobal_val的地址相同，但是父子进程从这个地址中获取的值却并不相同！

从同一块物理地址中取出的值是相同的，所以这个程序取出的地址（指针）并不是物理地址，而是虚拟地址（线性地址、逻辑地址）。注：逻辑地址指可执行程序编译完成后内部函数、变量的地址。逻辑地址有两种表示方法，一种是各个区域地址递增，另一种是每个区域的地址都从零偏移量开始（这种是比较老的表示方式）。

在Linux中的逻辑地址是第一种表示方式，所以Linux中逻辑地址就是虚拟地址。

之前学习的C/C++内存区域，是一块虚拟内存空间，每个进程有它自己的虚拟内存空间，即进程地址空间。所以上面的代码用fork创建子进程，因为子进程是父进程的拷贝，父子进程的grobal_val虽然虚拟地址一样，但会被映射到不同的物理地址上。

当grobal_val未被改变时，父子进程映射同一块grobal_val的物理地址，一旦父子进程的一方对共享数据进行修改，由于进程的独立性，操作系统会在物理内存中再开辟一块空间，并拷贝原数据，提出修改的进程的页表映射关系将会被改变，然后再让进程对数据进行修改，所以我们看到父子进程的数据并不一样。这种技术称为写时拷贝，对不同进程的数据进行分离。

二、对进程地址空间的理解

1、进程它自己会认为它独占CPU资源，但其实并不是。因为进程以时间片轮转的形式占用CPU资源，时间一到，马上从运行状态进入休眠状态，实质上是通过虚拟地址空间，让进程认为它独占CPU资源。

2、进程地址空间是操作系统给进程开辟的一块虚拟内存空间，这块空间用内核的一种数据结构来描述、组织。

操作系统给每个进程一块4GB的虚拟内存，进程每次想使用，按需申请即可，但不会全部给进程。（注意这里给的是虚拟内存，就像老板给员工画饼一样）

对Linux操作系统中进程的理解中提到过，进程使用进程控制块task_struct结构体进行管理，同样的，每个进程地址空间也需要被管理，管理进程地址空间的结构体叫mm_struct，task_struct中有一个指针指向自己的mm_struct。

mm_struct伪代码：

struct mm_struct
{
	uint32_t code_start,code_end;
	uint32_t data_start,data_end;
	uint32_t heap_start,heap_end;
	uint32_t stack_start,stack_end;
	······//存储进程地址空间各区域的起始位置
};