linux进程（进程地址空间）

最新推荐文章于 2024-08-23 09:49:22 发布

养乌龟的小少年

最新推荐文章于 2024-08-23 09:49:22 发布

阅读量828

点赞数 21

分类专栏： linux 文章标签： linux 算法运维

本文链接：https://blog.csdn.net/weixin_45476980/article/details/136093234

版权

linux 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

文章详细探讨了C/C++编程中内存的栈区、堆区、静态区等概念，解释了地址空间与物理空间的区别，以及如何通过fork操作验证地址空间。重点介绍了Linux内核的地址空间结构，虚拟地址空间在保护物理内存、进程管理和内存管理中的作用，以及虚拟地址如何通过页表映射到物理地址实现独立性和安全性。

摘要由CSDN通过智能技术生成

前言：

对于 C/C++ 来说，程序中的内存包括这几部分：栈区、堆区、静态区等，其中各个部分功能都不相同，比如函数的栈帧位于栈区，动态申请的空间位于堆区，全局变量和常量位于静态区，区域划分的意义是为了更好的使用和管理空间，那么真实物理空间也是如此划分吗？多进程运行时，又是如何区分空间的呢？写时拷贝机制原理是什么？本文将对这些问题进行解答

正文：

1.验证地址空间

我们通过代码验证一下，各部分数据处于的位置

#include <stdio.h>    
#include <unistd.h>    
#include <stdlib.h>    
    
int g_unval;    
int g_val = 100;    
    
    
int main(int argc, char *argv[], char *env[])    
{    
   // int a = 10;    
    //字面常量    
   const char *str = "helloworld";    
   // 10;    
   // 'a';    
    printf("code addr: %p\n", main);    
    printf("init global addr: %p\n", &g_val);    
    printf("uninit global addr: %p\n", &g_unval);    
    
    char *heap_mem = (char*)malloc(10);    
    char *heap_mem1 = (char*)malloc(10);    
    printf("heap addr: %p\n", heap_mem); //heap_mem(0), &heap_mem(1)    
    printf("heap addr: %p\n", heap_mem1); //heap_mem(0), &heap_mem(1)    
                                                                                                                                                             
    printf("stack addr: %p\n", &heap_mem); //heap_mem(0), &heap_mem(1)    
    printf("stack addr: %p\n", &heap_mem1); //heap_mem(0), &heap_mem(1)    
    
    printf("read only string addr: %p\n", str);    
    int i;    
    for(i = 0 ;i < argc; i++)
    {
        printf("argv[%d]: %p\n", i, argv[i]);
    }
    for(i = 0; env[i]; i++)
    {
        printf("env[%d]: %p\n", i, env[i]);
    }
 
    return 0;
}

2.地址空间是指物理空间吗

我们利用fork（）系统调用函数创建子进程，让父子进程共同使用同一个变量

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <stdlib.h>

int main()
{
  int val = 10;
  pid_t id = fork();
  if(id == 0)
  {
  	val *= 2;	//刻意改变共享值
    printf("我是子进程，pid:%d ppid:%d 共享值:%d 共享值地址:%p\n", getpid(), getppid(), val, &val);
    exit(0);
  }

  waitpid(id, 0, 0);

  printf("我是父进程，pid:%d ppid:%d 共享值:%d 共享值地址:%p\n", getpid(), getppid(), val, &val);
  return 0;
}

怎么同一个变量，同一个地址，同时读取读到了不同内容呢！！如果地址空间是实实在在的物理地址，同一地址是不可嗯呢读取到两个值，所以结论就是地址空间是虚拟地址也叫线性地址，语言层面包括c/c++都是虚拟地址，用户无法看到真实地址，由操作系统统一管理。

3.linux内核的地址空间

地址空间本质就是一种内核数据结构，在Linux当中，叫做struct mm_struct(linux内核当中的地址空间结构体)包含了一些区域信息（先描述），能够实现区域划分（本质就是在一定的范围内定义start和end）。

struct mm_struct
{
    unsigned long code_start;
    unsigned long code_end;
    
    unsigned long init_start;
    unsigned long init_end;
    
    unsigned long uninit_start;
    unsigned long uninit_end;
    
    unsigned long heap_start;
    unsigned long heap_end;
    
    unsigned long stack_start;
    unsigned long stack_end;
    //...等不同的区域划分
}

每个进程都会有自己的地址空间，同时进程控制块（PCB）中也包含了 *mm_struct 指针，可使我们直接找到自己所对应的进程地址空间（后组织）。

上述讲述的这么多，我们可以理解为进程地址空间就是操作系统给进程花了一个大饼。

这个大饼就是指的每个进程都会有4GB的连续的空间（0x00000000~0xFFFFFFFF）。实际上呢，这4GB的的空间是虚拟内存，虚拟内存对应的实际物理内存，可能只对应的分配了一点点的物理内存，实际使用了多少内存，就会对应多少物理内存。

这4G虚拟内存是一个连续的地址空间（这也只是进程认为），而实际上，它的数据是存储在多个物理内存碎片的，还有一部分存储在外部磁盘存储器上，在需要时将数据交换进物理内存。

4进程访问地址

4.1早期程序寻址

在虚拟地址出现之前，程序的寻址都是直接寻找的物理地址。但是这样会有很多的不足：

直接访问物理内存不安全。例如我们假如使用了野指针，对内存中的数据进行了修改，那么这个时就会影响到其他的进程；
因为物理内存是有限的，当有多个进程要执行的时候，对每个进程都要分配4G内存，很显然你内存若小一点，这很快就分配完了，于是没有得到分配资源的进程就只能等待。当一个进程执行完后，再将等待的进程装入内存。这种频繁的装入内存的操作是很没效率的。
因为内存是随机分配的，所以程序运行的地址也是不正确的。例如下面的代码就会出现野指针的问题

4.2进程地址空间到物理内存的映射

为了解决各种问题，大佬们提出了 虚拟地址空间 这个概念，有了 虚拟空间 后，当进程创建时，系统会为其分配属于自己的 虚拟空间，需要使用内存时，通过 寻址 的方式，使用物理地址上的空间即可。如下图所示：

当有多个进程，具体情况就如下图所示：

地址空间和页表是每个进程都独有的一份，只要保证每一个进程的页表，能够映射到不同区域的物理内存，就能够做到进程之间互不干扰。这就是我们所说的进程所具有独立性。

映射是由谁来完成的呢？答案是操作系统！操作系统通过地址转换机制将虚拟地址映射到物理地址，以实现对内存的访问。这种映射通常在页表或段表等数据结构上实现，其中存储了虚拟地址与物理地址之间的映射关系。

4.3解释同一变量产生不同值

相同的地址打印出不同的数据。注意，我们所访问到的地址都是虚拟地址。并不是物理地址。我们创建了一个子进程，子进程本身是继承了父进程的数据和代码。在没有对数据进行修改之前，子进程和父进程共享了一份数据。一但对子进程或者父进程的数据进行修改，就会发生写时拷贝。对修改的数据进行深拷贝，从而达到对彼此不产生干扰，实现进程独立性。

那就对相同地址打印出不同数据的现象不难理解了。当我们对父进程的数据进行修改时，父进程发生了写时拷贝，在内存中开辟了空间。但他们都有自己的地址空间（虚拟地址），所以地址相同也是正常现象（子进程继承父进程的代码和数据）。即使虚拟地址一样，但是可通过页表映射到不同的物理内存中。具体如下图：