进程在虚拟地址空间的布局
操作系统把磁盘上可执行文件加载到内存运行之前, 需要做很多工作, 其中很重要的一件事就是把可执行文件中的代码, 数据存放到内存 中合适的位置, 并分配和初始化程序运行过程中必须的堆栈, 所有准备工作完成之后操作系统才会调度程序起来运行.
进程在内存中布局主要分为4个区域: 代码区, 数据区, heap和stack.
- 代码区, 包括被CPU执行的机器代码(指令)和只读数据比如字符串常亮, 程序一旦加载完成代码区大小就不会再变化了. "代码"就是编 译器编译成机器代码的结果.
- 数据区, 包括程序的全局变量和静态变量, 与代码区一样, 程序加载完毕后数据区的大小也不会发生变化.
- heap, 程序运行时动态分配的内存位于 heap 中, 这部分内存由内存分配器负责管理. 该区域的大小会随着程序的运行而变化. 当我们向 heap 请求分配内存但分配器发现 heap 当中内存不足时, 它会向操作系统内核申请向高地址方向扩展堆的大小, 而当我们释放内存把它归还给堆时, 如果内存分配器发现剩余空闲内存太对则又会向操作系统请求向低地址方向收缩堆的大小.
函数调用栈
函数调用栈简称栈, 在程序运行过程中, 不管是函数执行还是函数调用, 栈都非常关键, 它的主要作用:
- 保存函数的局部变量;
- 向被调用函数传递参数;
- 返回函数的返回值;
- 保存函数的返回地址. 返回地址是指从被调用函数返回后调用者应该继续执行的指令地址
每个函数在执行过程中都需要使用一块栈内存用来保存上述这些值, 称这块栈内存为函数的栈帧(stack frame). 当发生函数调用时, 因为调用者还没有执行完成, 其栈内存中保存的数据还有用, 所以被调用函数不能覆盖调用者的栈帧, 只能把被调用函数的栈帧"push" 到栈上, 等被调用函数执行完成后再将其栈帧从栈上 “pop” 出去. 这样, 栈大小随着函数调用层级的增加而生长, 随函数的返回而缩 小.
总结栈帧:
- 栈帧是一块因函数运行而临时开辟的空间。
- 每调用一次函数便会创建一个独立栈帧。
- 栈帧中存放的是函数中的必要信息,如局部变量、函数传参、返回值等。
- 当函数运行完毕栈帧将会销毁。
常用寄存器以及相关指令
寄存器 | 用途 |
---|---|
EAX | 累加寄存器:用于乘除法、函数返回值 |
EBX | 用于存放内存数据指针 |
ECX | 计数器 |
EDX | 用于乘除法、IO指针 |
ESI | 源索引寄存器,存放源字符串指针 |
EDI | 目标索引寄存器,存放目标字符串指针 |
ESP | 存放栈顶指针 |
EBP | 存放栈底指针 |
汇编指令 | 用途 |
---|---|
mov | mov A,B 将数据B移动到A |
push | 压栈 |
pop | 出栈 |
call | 函数调用 |
add | 加法 |
sub | 减法 |
rep | 重复 |
lea | 加载有效地址 |
栈帧创建销毁过程
int sum(int a, int b)
{
int s = a + b;
return s;
}
int main(int argc, char* argv[])
{
int a = 1, b = 2;
int n = 0;
int n = sum(a, b);
printf("n: %d\n", n);
return 0;
}
根据VS2019编译器调试,调用堆栈,不难发现sum函数在被调用时,创建了栈帧。在调试过程中将转到反汇编,便能直观的看到main函数栈帧创建的过程。首先需明确的是,函数栈帧由寄存器esp,ebp维护。
00761960 push ebp
00761961 mov ebp,esp
00761963 sub esp,0CCh
00761969 push ebx
0076196A push esi
0076196B push edi
0076196C lea edi,[ebp-0Ch]
0076196F mov ecx,3
00761974 mov eax,0CCCCCCCCh
00761979 rep stos dword ptr es:[edi]
1.在__tmainCRTStartup()函数顶部压入ebp,如图所示esp指向ebp,ebp成功压入栈中。
2.esp值传递给ebp。
3.esp减去0CCh:由于栈先使用高地址后使用低地址,减去一个值意味着esp指针向低地址移动了0CCh个地址,此处便开辟了main函数的栈帧。
4.压入ebx,esp指向ebx顶部。
5.压入esi,esp指向esi顶部。
6.压入edi,esp指向edi顶部。
7.将edi向下3h个空间全部改为0xCCCCCCCC。
局部变量创建
函数传参
函数调用
这个过程与此前main函数开辟栈帧的过程类似,说明sum()函数调用又开辟了一块独立的栈帧。
函数返回
将返回值传递至寄存器eax中,因此在函数调用结束函数栈帧被销毁时,返回值并不会销毁。在函数拿到返回值后,开始出栈: