【Linux】进程虚拟地址空间

在这里插入图片描述
在这里插入图片描述

🔥小实验

我们先来看一段代码 ——

在这里插入图片描述

惊奇的发现:同一个地址,居然打出了不同的变量

在这里插入图片描述

怎么可能同一个地址,同时读取的时候,出现了不同的值?
这里的地址,绝对不是物理地址❗❗ 而是虚拟地址

注:

  • 几乎所以的语言,如果他有“地址”的概念,这个地址一定不是物理地址,而是虚拟地址
🔥验证地址空间排布

上代码——

#include<stdio.h>
#include<stdlib.h> // malloc

int g_unval;    // 未初始化数据区
int g_val = 10; // 已初始化数据区

int main(int argc, char\* argv[], char\* env[])
{
    printf("code addr : %p\n", main); // 代码区

    printf("\n");
    const char \*p = "hello";
    printf("read only : %p\n", p);    // 字符常量区(只读)

    printf("\n");
    printf("global val : %p\n", &g_val);   // 已初始化数据区
    printf("global uninit val: %p\n", &g_unval); // 未初始化数据区

    printf("\n");
    char \*heap_men = (char\*)malloc(10);
    char \*heap_men2 = (char\*)malloc(10);
    char \*heap_men3 = (char\*)malloc(10);
    printf("head addr : %p\n", heap_men);  // 堆区(向上增长)
    printf("head addr : %p\n", heap_men2);
    printf("head addr : %p\n", heap_men3);
    
    printf("stack addr : %p\n", &heap_men);     // 栈区(向下增长)
    printf("stack addr : %p\n", &heap_men2);   //heap\_men本质就是main函数里的指针变量,开辟了空间,所以直接&
    printf("stack addr : %p\n", &heap_men3);
    int i=0;
    for(i=0 ; i < argc; i++)
    {
       printf("argv[%d]: %p\n", i, argv[i]);
    }
    for(i=0;env[i]; i++)
    {
       printf("env[%d]: %p\n ", i, env[i]);
    } 
    return 0;
}

运行结果:

在这里插入图片描述

口诀:堆,栈相对而生

🔥语法小问题

1️⃣ 上面的代码,我们malloc了10个字节,可是打印出来的时候

在这里插入图片描述

却相隔了20个字节,其实是操作系统多申请了字节,其中多申请的字节放的是堆的属性信息(cookie数据:申请的时间,堆的大小等等

2️⃣ static修饰变量呢?

static int test = 10;
printf("test stack addr: %p\n", &test);

在这里插入图片描述
🌈static修饰局部变量,本质是把static变量开辟在了全局区域

3️⃣在32位下,一个进程的地址空间,取值范围是:0x00000000 ~ 0xFFFFFFFF

  • 【0,3G】:用户空间
  • 【3G,4G】:内核空间

上面的验证代码,在windows下会跑出不一样的结果❗

上面的结论,默认只在Linux下有效!

二. 进程地址空间

🌈 地址空间是什么 (what?)

所以之前所说的“程序地址空间”是不准确的,准确的说是“进程地址空间”,那么什么是进程地址空间呢?

假设有一个富豪,他有 10 亿美元的家产,而这个富豪他有 3 个私生子,但这 3个私生子此之间并不知道对方的存在,这个富豪对他的每个私生子都说过同一句话:儿子,这10亿的家产未来都是你的。
站在每个私生子的视角中,每个私生子都认为自己拥有 10 亿美元。
如果每个私生子都找父亲一次性要 10 个亿,这个富豪是拿不出来的,但实际上这是不可能的,每个私生子找父亲要钱,一般只会几千几万这样一点点去要,这个富豪只要有,就一定会给。如果私生子要的钱太多,富豪不给,私生子也只会认为是父亲不想给我。
换言之,这个富豪给每个私生子在大脑中建立一个「虚拟」的概念:都认为自己拥有 10 亿美元。类比到计算机中:

  • 富豪,称之为操作系统
  • 私生子,称之为一个个独立的进程
  • 富豪给私生子画的 10 亿家产(大饼),称之为进程的地址空间

1️⃣ 我们直接访问物理内存,特别不安全野指针等)
在这里插入图片描述

💦所以让用户不能直接用物理地址

每个进程都要有一个地址空间,操作系统为每一个进程画了一个大饼,它们都认为自己在独占物理内存
系统中存在大量进程,需要管理地址空间,那么就需要先描述再组织(今天不考虑)

📌内核中的地址空间,本质也一定是一种数据结构,将来一定要和特定的进程关联起来

struct mm\_struct
{
    //进程地址空间
}

在这里插入图片描述

那么我们是如何用struct结构体进行划分区域?各个区域又是如何与物理内存建立关联的?

🌈 地址空间是如何设计(how?)
🌊区域划分 & 页表映射

💦地址空间是一种内核数据结构,它里面至少要有:各个区域的划分
在这里插入图片描述

其中堆栈增长会有范围的变化:本质其实就是对start 或者end标记值 ±特定的范围即可!!

地址空间和页表(用户级)是每个进程都私有一份

💦那么如何将虚拟地址和物理地址建立映射关系呢?通过页表

在这里插入图片描述

只要保证,每一个进程的页表,映射的是物理内存的不同区域,就能做到,进程之间不会互相干扰,保证了进程的独立性!!

页表+MMU进行映射

  • MMU是Memory Manage Unit的缩写,即存储管理单元,是中央处理器用来管理虚拟内存和物理内存寄存器的控制线路,也负责虚拟内存映射为物理内存。
🌈 为什么要有地址空间(why?)
1️⃣保护物理内存

添加一层软件层,完成有效的对进程操作内存的风险管理(权限管理),有效的保护了物理内存,本质是为了保护物理内存各个进程的数据安全
凡是非法的访问或者映射,OS都会识别到并且终止你这个进程!!

OS是怎么样识别到?(后面多线程讲)、OS是怎么样终止的呢?(后面信号讲)卖个关子

类似于过年的压岁钱妈妈帮你收着,等你要用的时候,再来问我要,防止你乱花钱。对应到这里,意味着凡是想使用地址空间和页表进行映射,一定要在OS的监管之下访问呢,如果没有中间层(OS),能直接访问物理地址,可能发生非法越界访问。

在这里插入图片描述

在语言层面上,我们知道,字符串存在字符常量区不能修改 ——

char\* str = "hero never die;
\*str = 'b'; //不能修改

📌本质上是因为,这里str指针就是虚拟地址,*解引用进行写入时,访问虚拟地址,要进行虚拟地址和物理地址的转化,然而OS只给你读r权限,就访问不了物理内存了,也就修改不了

在这里插入图片描述

2️⃣解耦合 与 延迟分配

🔥内存管理模块 vs 进程管理模块 之间关联性减少
通过虚拟地址空间,来屏蔽底层申请内存的过程,达到进程读写内存操作和OS进行内存管理进行软件层面上的分离。

如果我们申请了物理空间,但是如果我不立马使用,是不是空间的浪费呢?
答:是的 ❗ 本质上,(因为有地址空间的存在,所以上层申请空间,其实是在地址空间上申请的,物理内存可以甚至一个字节都不给你,而当你真正进行对物理地址空间访问的时候,才执行内存的相关管理算法,帮你申请内存,构建页表映射关系),然后才让你进行内存访问的

  • 以上延迟分配,可以提高整机的效率,几乎内存的有效使用率是100%

上面括号部分是由OS自动完成,用户包括进程都是完全0感知!!
这叫做基于缺页中断进行物理内存申请。

ps:好比你妈妈说明天要给你买玩具,但是今晚却把钱借给了二舅,二舅还的上还好,一旦还不上,也就不够钱了对应内存不足的情况

3️⃣进程独立性

➰由于页表的存在,它可以将地址空间上的虚拟地址和物理地址进行映射,那么是不是在进程视角所以的内存分布都可以是有序的!

  • 所以地址空间➕页表的存在 ,可以将内存分布有序化

➰进程要访问的物理内存中的数据和代码,可能目前并没有在物理内存中,同样的,也可以让不同的进程映射到不同的物理内存,也就实现了进程独立性的实现!!

  • 进程的独立性,可以通过地址空间➕页表的方式实现!

总结:因为有地址空间的存在,每一个进程都认为自己拥有4GB空间(32),并且各个区域是有序的,进而可以通过页表映射到不同的区域,来实现进程的独立性
ps:每个进程不知道且不需要知道其他进程的存在(好比大富翁的每个私生子)

操作系统(大富翁👨)给每个进程(私生子👶)都给的是全部的地址空间(10G),也就是私生子认为自己是独占的,体现出了独立性

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 14
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值