linux进程运行空间分析

最新推荐文章于 2024-05-27 20:10:17 发布

ww188

最新推荐文章于 2024-05-27 20:10:17 发布

阅读量678

点赞数

分类专栏： c++

本文链接：https://blog.csdn.net/ww188/article/details/82841617

版权

c++ 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

7.1 进程运行空间

程序编译链接成功后，要运行；由自己的虚地址空间，映射到物理地址空间进行运行；可执行文件的虚地址空间，也就是进程运行空间，是怎么划分的？

linux-64bit机器为例：

地址64bit,标识范围：0x0000000000000000 ~ 0xFFFFFFFFFFFFFFFF
text segment: 代码段二进制代码；从虚拟内存地址00400000开始，这个地址是固定的。使用pmap PID可以查看到；
data segment: 存放已经初始化的全局变量，静态变量
BSS segment：未初始化的全局变量，会初始化默认值；
heap 段： c++动态内存分配运算符new,delete c动态内存分配函数：malloc alloc free
Memeory mapping region:
mmap系统调用可将文件映射入进程memory map地址空间；
使用ldd命令，我们可以看到进程依赖的库文件，这些库文件编译过程中都要关联到此虚拟地址空间；
stack 段：函数局部变量，函数调用等都保存在stack区，地址由高到低的分配内存；
使用pmap PID 或 cat /proc/PID/maps 查看进程空间:
maps文件格式：
地址：库在进程里地址范围
权限：虚拟内存的权限，r=读，w=写,x=,s=共享,p=私有；
偏移量：库在进程里地址范围
设备：映像文件的主设备号和次设备号；
节点：映像文件的节点号；
路径: 映像文件的路径
每项都与一个vm_area_struct结构成员对应

7.2 x86-64寄存器体系和汇编指令

7.2.1 寄存器体系

调用者保护：主函数作为调用者，调用子函数时，某些寄存器中的数据需要压栈保护，以便于恢复，不被覆盖；这个动作由主函数完成；对应的寄存器叫caller save
被调用者保护：callee save 子函数压栈保护寄存器中内容；
%rax 通常用于存储函数调用的返回结果，同时也用于乘法和除法指令中。在imul 指令中，两个64位的乘法最多会产生128位的结果，需要 %rax 与 %rdx 共同存储乘法结果，在div 指令中被除数是128 位的，同样需要%rax 与 %rdx 共同存储被除数。
%rsp 是堆栈指针寄存器，通常会指向栈顶位置，堆栈的 pop 和push 操作就是通过改变 %rsp 的值即移动堆栈指针的位置来实现的。
%rbp 是栈帧指针，用于标识当前栈帧的起始位置
%rdi, %rsi, %rdx, %rcx,%r8, %r9 六个寄存器用于存储函数调用时的6个参数（如果有6个或6个以上参数的话）。

7.2.2 常用汇编命令

7.3 函数调用运行进制

7.3.1 函数栈帧

注意，这是栈区，存在函数调用时内存分布。也就是所谓的函数调用栈；

7.3.2 函数调用

调用者：参数从右向左依次压栈 -》函数返回地址(函数名)压栈 -》跳转到子函数的首地址执行代码 -》
被调用者： 上一个函数栈帧rbp指针压栈 -》同时修改当前栈帧指针为当前地址 -》继续执行子函数
汇编代码示例：

...   # 参数压栈
call FUNC  # 保存返回地址，并跳转到子函数 FUNC 处执行；两个功能合并；
...  # 函数调用的返回位置

FUNC:  # 子函数入口
pushq %rbp  # 保存旧的帧指针，相当于创建新的栈帧
movq  %rsp, %rbp  # 让 %rbp 指向新栈帧的起始位置
subq  $N, %rsp  # 在新栈帧中预留一些空位，供子程序使用，用 (%rsp+K) 或 (%rbp-K) 的形式引用空位

7.3.3 函数返回

思考:当函数调用结束，如何恢复调用者函数栈空间，并进行执行？
1、rbp-》rsp：也就是栈顶指针恢复到rbp处
2、rsp中的内容 -》上一个rbp：利用栈顶指针中的内容，恢复调用函数rbp
3、%rsp此时指向返回地址，取出来，调用函数继续执行；参数由编译器自动释放；
4、函数返回值保存在：%rax

上面的过程，实际对应的指令leave和ret：

leave 指令：恢复主函数的栈帧; 执行完后，%rsp正好指向，主函数返回地址处；%rbp指向主函数栈帧起始位置；分解出来实现代码：

movq %rbp, %rsp    # 使 %rsp 和 %rbp 指向同一位置，即子栈帧的起始处
popq %rbp # 将栈中保存的父栈帧的 %rbp 的值赋值给 %rbp，并且 %rsp 上移一个位置指向父栈帧的结尾处

ret 指令： %rsp指向返回地址取出，跳到返回地址处，继续执行主函数指令；调用参数由编译器自动释放；

7.4 函数调用实例分析

1、示例代码：test.c

int add(int a, int b, int c, int d, int e, int f, int g, int h) { // 8 个参数相加 int sum = a + b + c + d + e + f + g + h; return sum; } int main(void) { int i = 10; int j = 20; int k = i + j; int sum = add(11, 22,33, 44, 55, 66, 77, 88); int m = k; // 为了观察 %rax Caller Save 寄存器的恢复 return 0; }

2、汇编代码分析

查看汇编代码：（1） gcc -S test.c -o test.s （2） gdb test_bin -> disassemble 函数名 gdb的反汇编功能

main代码分析：

main:
.LFB3:
	pushq	%rbp  #主函数栈帧指针压栈；被调函数必做的事情;main也是某个函数的子函数；
.LCFI2:
	movq	%rsp, %rbp  #创建子函数栈帧；起始地址；必做；
.LCFI3:
	subq	$40, %rsp  #栈帧分配40bytes空间；减法；栈是向下生长
.LCFI4:
	movl	$10, -4(%rbp)  # 立即数+ 基址寻址：将10 -》(*(%rbp)-4)
	movl	$20, -8(%rbp)  # 同上，对应代码：j = 20;
	movl	-8(%rbp), %eax 
	addl	-4(%rbp), %eax # 进行加法运算，同时把结果存放再%rax中
	movl	%eax, -12(%rbp) # 这一步验证了%rax是caller save 寄存器；在调用子函数前将结果压栈
	movl	$88, 8(%rsp) # 第8个参数压栈，使用%rsp上面的第8个空间
	movl	$77, (%rsp)  
	movl	$66, %r9d    # 小于6个参数压栈进入寄存器
	movl	$55, %r8d
	movl	$44, %ecx
	movl	$33, %edx
	movl	$22, %esi
	movl	$11, %edi
	call	add        #调用子函数add：保存调用函数返回地址，病进入到子函数
	movl	%eax, -16(%rbp)  #将add函数的返回值%eax保存到栈中；int sum = add(...)
	movl	-12(%rbp), %eax  #将调用add之前，保存的 k= i+j的结果，恢复
	movl	%eax, -20(%rbp)  #对应源码：int m = k 命令； 
	movl	$0, %eax  # return 0；所以返回值要置为0；返回到上一个主函数
	leave  # 恢复主函数栈帧；rbp，rsp
	ret    # 返回并跳转到主函数调用处下一条指令处，继续执行

add函数分析：


add:
.LFB2:
	pushq	%rbp  #主函数栈帧指针压栈；刚进子函数必做的事情
.LCFI0:
	movq	%rsp, %rbp  #子函数栈帧起始地址赋值；必做；
.LCFI1:
	movl	%edi, -4(%rbp)  # 将参数入栈；这种操作，相当于push %edi，(%rsp)
	movl	%esi, -8(%rbp)  # 由于子程序中可能会用到参数的内存地址，这些参数放在寄存器中是无法取地址的，这里把参数压栈，印证了我们之前的猜想:寄存器中的参数，也要入栈的。
	movl	%edx, -12(%rbp)
	movl	%ecx, -16(%rbp)
	movl	%r8d, -20(%rbp)
	movl	%r9d, -24(%rbp)
	movl	-8(%rbp), %eax
	addl	-4(%rbp), %eax  
	addl	-12(%rbp), %eax
	addl	-16(%rbp), %eax
	addl	-20(%rbp), %eax
	addl	-24(%rbp), %eax
	addl	16(%rbp), %eax  #取第7个参数；为什么是16(%rbp)？ 参考下面的总结
	addl	24(%rbp), %eax
	movl	%eax, -28(%rbp) # sum=a+b+c...
	movl	-28(%rbp), %eax
	leave
	ret

3、总结说明

(1):在汇编程序中，如果使用的是64位通用寄存器的低32位，则寄存器以 ”e“ 开头，比如 %eax，%ebx 等，对于 %r8-%r15，其低32 位是在64位寄存后加 “d” 来表示，比如 %r8d, %r9d
(2):如果操作数是32 位的，则指令以 ”l“ 结尾，例如 movl $11, %esi，指令和寄存器都是32位的格式。如果操作数是64 位的，则指令以 q 结尾，例如 “movq %rsp, %rbp”
(3): 程序运行到取第7个参数时，栈帧情况：原理，就是基于子函数的rbp来访问主函数的内存区域，因为参数超过6个，只能放到内存区域来传递；

Reference

1、http://blog.chinaunix.net/uid-27119491-id-3325943.html 《x86-64 进程地址空间》同时参考： Chapter 15 - The Process Address Space, Linux kernel development.3rd.Edition

2、http://blog.csdn.net/lqt641/article/details/73002566 《x86-64 下函数调用及栈帧原理》这篇文章参考的多

ww188

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
linux进程运行空间分析

7.1 进程运行空间程序编译链接成功后，要运行；由自己的虚地址空间，映射到物理地址空间进行运行；可执行文件的虚地址空间，也就是进程运行空间，是怎么划分的？linux-64bit机器为例：地址64bit,标识范围：0x0000000000000000 ~ 0xFFFFFFFFFFFFFFFF text segment: 代码段二进制代码；从虚拟内存地址0040000...
复制链接

扫一扫