进程地址空间
相信大家都知道C语言对内存空间进行了划分
其实这不是真正的物理内存而是语言层面的叫做进程地址空间,下面来看一段代码验证这个说法。
1 #include <stdio.h>
2 #include <unistd.h>
3
4 int val = 100;
5 int main()
6 {
7 pid_t id = fork();
8 if(id == 0)
9 {
10 int cnt = 0;
11 while(1)
12 {
13 printf("I am child, pid:%d,ppid:%d,val:%d,&val:%p\n",getpid(),getppid(),val,&val);
14 if(cnt == 5)
15 {
16 val = 200;
17 printf("child val change,100 -> 200\n");
18 }
19 cnt++;
20 sleep(2);
21 }
22 }
23
24 while(1)
25 {
26 printf("I am father, pid:%d,ppid:%d,val:%d,&val:%p\n",getpid(),getppid(),val,&val);
27 sleep(2);
28 }
29
30 return 0;
31 }
根据前面的知识我们知道,父子进程是共享代码和数据,前面打印的结果也验证了这个道理,但当子进程对数据进行修改,那么会发生写时拷贝,这也是容易接受的,但是难以理解的是修改数据,发生拷贝之后,地址竟然是一样的?数据存在内存上,一个地址竟然有两个数据,所以可以判断打印出来的地址肯定不是物理内存上的地址,该地址是进程地址空间上的虚拟地址。 引入了这个概念之后,我们就可以解释之前fork()有两个返回值不一样的问题了。
在虚拟内存和物理内存之间存在一个叫做页表的东西,进行虚拟内存和物理内存之间的映射。进程地址空间和页表是每个进程都有一个,子进程会继承父进程的进程地址空间和页表。
这是没有进行写实拷贝的状态
如果发生了写实拷贝,子进程的页表转换关系就会改变,重新映射。
那进程地址空间到底是什么呢?
其实地址空间没那么神秘,一个进程有一个地址空间,如何管理呢?先描述再组织。地址空间就是一个结构体数据结构
因为地址空间可以对地址进行划分,所以该结构体里面肯定有的字段是,一个区域的开始和结束,用于分配空间和查明是否越界。
使用地址空间的好处:
- 将物理内存中无序的进程通过页表映射变得有序。
- 使进程管理和内存管理进行解耦,只需要通过页表交互
- 提高了内存的安全性。