程序地址空间
我们在学习C语言的时候,都画过一个内存空间的空间布局图,如下
接下来我们用代码看看在程序中,地址空间是不是这样布局的
1 #include<stdio.h>
2 #include<stdlib.h>
3
4 // 定义两个全局变量,一个初始化,一个不初始化
5 int g_uninit;
6 int g_init = 10;
7
8 int main()
9 {
10 const char* s = "hello world";// 定义一个常量字符串
11 printf("代码区内存地址:%p\n", main);
12 printf("常量字符串地址:%p\n", s);
13 printf("未初始化全局变量地址:%p\n", &g_uninit);
14 printf("初始化的全局变量地址:%p\n", &g_uninit);
15
16 char* heap = (char*)malloc(10); // 在堆空间上开辟一段空间
17 printf("堆空间的地址:%p\n", heap);
18 printf("栈空间的地址:%p\n", &s);
19 printf("栈空间的地址:%p\n", &heap);
20
21
22
23 return 0;
24 }
多进程的地址空间
我们知道了,内存空间的布局。我们知道每一个进程都是独立的,子进程在创建的时候是通过父进程的模板创建的,在子进程进行修改的时候,会发生写时拷贝。那么下面我们看看一段代码来感受一下。
[tpm@localhost course]$ cat myproctest.c
#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>
// 定义两个全局变量,一个初始化,一个不初始化
int g_uninit;
int g_init = 10;
int main()
{
// 数据是各自私有一份的(写时拷贝)
if(fork() == 0)
{
// 子进程
int cnt = 5;
while(cnt)
{
printf("我是子进程,第%d次, g_init = %d, g_init的地址:%p\n",cnt, g_init, &g_init);
cnt--;
sleep(1);
// 修改g_init
if(cnt == 3)
{
printf("############子进程更改数据############\n");
g_init = 200;
printf("############子进程更改数据############\n");
}
}
}
else{
// 父进程
while(1)
{
printf("我是父进程,g_init = %d, g_init的地址:%p\n", g_init, &g_init);
sleep(1);
}
}
return 0;
}
我们执行了上面的代码后,发现最开始的时候,子进程和父进程去访问
g_init
的变量的时候,打印结果都是10,而且他们的地址都是一样的0x60104c
,可是,我们知道,在子进程修改数据时是会发生写时拷贝的。这个时候我们发现虽然子进程和父进程看到的内容是变了,可是地址却没变。这是为什么呢?
进程地址空间图解
其实在linux中,我们通过代码所得到的地址,并不是实实在在的内存地址,而是一个虚拟地址。它是物理内存的一个映射。
举个例子:
有一个身家300亿大富豪,他有10个私生子。这10个私生子都彼此不知道对方的存在。这个大富豪,给每一个私生子都画了一张大饼,等他去世之后,就有你来继承他的300亿。这时,每个私生子都认为自己独占这300亿。那么类比过来,这个富豪,就是操作系统,他可以管理他的资产。而符号存钱的银行就是物理内存,他的每一个私生子就是进程,这位富豪给每个私生子画的饼就是进程地址空间
操作系统对于进程的管理是使用了一个task_struct结构来描述进程后再统一对PCB进行管理。也就是说在PCB中有一种数据类型是用来描述进程地址空间的。那么对于进程地址空间的图就应该像下面这样。
之前在学习语言的时候,学到使用常量数据不能被修改,其实他的本质就是操作系统只给了我们只读的权限,没有写如的权限。
为什么要有地址空间?
- 通过添加一层软件层,完成有效的对操作系统的内存进行风险管理(权限管理),本质目的是为了保护物理内存以及各个进程的数据安全
- 内存申请和内存使用的概念在时间上划分清楚,通过虚拟地址空间,来屏蔽底层申请内存的过程,达到进程读写内存和OS进行内存管理操作,进行软件上的分离
- 站在CPU和应用层的角度,进程统一可以看作统一的4GB空间,而且每个空间区域的相对位置,是比较确定的。
对于屏蔽底层申请内存过程的理解
假如用户申请了100字节的空间,我们是立马就能用吗?答案是否定的,用户有可能暂时不会把空间全部使用甚至是暂时,不使用空间。对于操作系统来说,如果立马把空间给用户,而用户又暂时不使用,就造成了资源的利用率不高。所以,是在你要用的时候才把相应的资源给到你。
结尾
所以,在我们上面的实验中,为什么发生了写时拷贝之后,子进程和父进程所对应的地址是一样的就能解释了。就是父进程和子进程使用的是不同的页表,他们的虚拟地址是一样的,可是物理地址发生了改变