Linux操作系统学习（进程地址空间）

hxMGE

已于 2023-03-03 16:25:55 修改

阅读量164

点赞数

文章标签： linux 学习

于 2023-02-14 02:11:25 首次发布

本文链接：https://blog.csdn.net/hxMGE/article/details/129020076

版权

文章目录

进程地址空间

进程地址空间

在我们学习其他编程语言时对于内存分布的概念是这样的

在Linux环境下可以验证一下。如下图所示：

奇怪的现象

我们知道fork创建一个子进程，子进程会继承父进程的代码和数据并以父进程为模板来创建自己，那么子进程的码中的变量地址也是一样的吗？

下面来验证一下：

int getval = 100;
int main()
{
  if(fork() == 0)
  {
    int count = 5;
    while(count)
    {
      cout << "child-> " << " count: " << count << " getval: " << getval << " &getval: " << &getval << endl;
      count--;
      sleep(2);
      if(count == 3)
      {
        cout << "********** getval = 50 **********" << endl; 
        getval = 50;
      }     
    }
  }
  else if(fork() > 0)
  {
    while(1)
    {
      cout << "parent-> " << " getval : " << getval <<  " &getval：" << &getval << endl;
      sleep(2);
    } 
  }

  return 0;
}

fork创建的子进程中，在不改变父进程的代码时他们共享的是同一份代码(继承)，当子进程发生改变时，会发生写实拷贝，才会将父进程的内容复制一份给子进程

子进程和父进程因为写实拷贝值不一样，但是为什么地址还是一样的呢？？？

先说结论：

变量内容不一样,所以父子进程输出的变量绝对不是同一个变量
但地址值是一样的，说明，该地址绝对不是物理地址！
在Linux地址下，这种地址叫做虚拟地址
我们在用C/C++语言所看到的地址，全部都是虚拟地址！物理地址，用户一概看不到，由OS统一管理 OS必须负责将虚拟地址转化成物理地址。

什么是进程地址空间？？？

进程地址空间其实是操作系统给进程画的一个大饼，让每一个进程都认为自己是独占操作系统中的所有资源（独占4GB）

我们知道每个进程都会有一个task_struct(PCB)用来描述这个进程，多个进程的PCB又会组织成数据结构（队列、链表），再由OS管理这个数据结构就可以间接管理到进程。

而在每个进程创建时都会创建一个进程地址空间struct mm_struct{}，同时在PCB中创建一个mm_struct的指针，也就可以对每个进程的地址空间管理了。

struct mm_struct：就是操作系统给每个进程创建一个结构体，用来记录每个进程中各个区域的开始位置起始位置等等。

如下图所示：

虚拟地址是如何与物理内存联系的？

这里又引入一个新的概念 “页表”

页表是什么呢？

页表就是记录虚拟地址对应的物理地址的一张映射表，由一些映射算法映射到物理地址上（类似哈希表）

页表还会存储各个区域划分的属性（读/写权限等等）

为什么要有页表和地址空间，让进程直接访问内存不行吗？

进程直接访问内存不是不可以，而是会有很多隐患，弊远远大于利，这里简单分为三个问题来解释：

1. 假如内存中加载了进程A、B、C，进程B的代码有越界BUG，而编译器不检查越界，就会导致进程B的的代码可以访问到进程A或进程C并修改

例如一些恶意进程，在我们手机中，微信是进程A，支付宝是进程B，还有个恶意进程C；由于中间没有任何干涉C进程直接访问内存，恶意读取进程A、B的数据如支付密码、登陆密码、账户余额等等，严重威胁信息安全

在进程添加页表、进程地址空间，由操作系统管理；而页表中的进程地址与物理地址的映射转换是由操作系统完成的，也就可以由操作系统检查页表映射位置是否匹配，权限是否匹配等问题

例如：

当进程地址中越界了，操作系统发现页表中没有对应到映射的物理地址，就会挂掉它

字符量区是只读属性的，当进程访问到常量区发生修改时，操作系统发现页表对应的物理地址是只读属性，就会挂掉该进程

2. 假如task_struct直接向内存申请了10000个字节空间，但是他没有立刻全部使用只是使用了小部分，当别人的进程申请空间时，发现空间不够了

站在操作系统的角度，如果空间申请后马上给到进程就意味着你闲置的空间，本来可以给别的进程使用，但是现在你不用也不许给别人用，空间浪费了。

2.而操作系统管理页表和进程地址空间就可以改善这个问题：

当进程申请空间时有可能是这样的：

申请空间较小，操作系统直接给它；

申请空间较大，操作系统不立马给，只是先记在页表并给进程回话 “你的内存申请我通过了”，等到进程读或写时操作系统才会去在页表中建立映射关系

例如当内存满了的时候：

进程是不知道他满了的，他申请内存时先记在了页表，操作系统只是答应它但没有马上给他；

等到进程去访问地址时，操作系统会执行一些相关的内存管理算法，把内存的整块的数据移至磁盘，把移走的数据内存地址放在页表与进程空间地址建立映射（或者在磁盘给他分一块空间）

进程申请空间，操作系统同意，但是不一定马上给他或者给他的是磁盘空间，当进程访问地址时才会去在页表中建立映射关系。这些进程都是不知道的，他只负责访问自己的虚拟地址标号，申请时记录在页表的虚拟地址部分，剩下的都由操作系统管理。

（类似于酒店房间预定）

CPU怎么知道代码的第一句在哪？（指main第一句）

有了进程地址空间和页表，可以规定把进程的代码中第一句放在页表指定位置（mian的第一句）

那么每个进程都把他们代码第一句放在同一个进程地址空间（虚拟地址是连续的，只需要记第一个位置即可），CPU只去读取每个进程页表的0X1234即可找到每个进程的代码第一句的位置，剩下的工作交给操作系统和页表

（前面介绍的PCB上下文数据，PCB运行队列的出口位置，把top的PCB对应的进程的代码和数据加载到CPU中执行）

同时也可以得出：每个进程的数据和代码可以加载到内存的任意位置，大大减少了管理内存的负担

总结：