2.汇编语言系统调用过程

以printf为例,详细解析一个简单的printf调用里头,系统究竟做了什么,各寄存器究竟如何变化。

如何在汇编调用glibc的函数?其实也很简单,根据c convention call的规则,参数反向压栈,call,然后结果保存在eax里头。注意,保存的是地址。

在汇编里头,一切皆地址。

当我们调用 result = printf( "%d %d", 12, a )的时候,编译器默认是这样处理的(除非函数定义声明了pascal call)。

在栈里头,先一次push a的地址,还有12这个立即数,再push "%d %d"这个字符串的地址,内存模型如下,x86的esp是往下增长的。

(这里是buttom,往下增长的是top)

&a

12

address of "%d %d"

-------------------------------------------(esp 指着这里 ,我们假设地址是4字节,12这个数也是4字节)

当call printf的时候,首先,push当前的eip入esp,解析esp+4所指的"%d %d",因为%d这样的特定字符都定义了后面每个参数的大小,所以只要解析“%d %d”,我们就可以知道栈里头参数的情况,例如esp+4+4就是一个int,esp+4+4+4是另外一个int。

当返回的时候,先pop到eip,也就是把eip还原到call之后马上要执行的机器码,这时,esp就指着“%d %d”,esp+4指着12,esp+8指着a的地址。esp里头的内容怎么处理,看需要吧,你也可以pop出来,也可以不pop。但为了效率着想,如果空间够用,通常不pop,直接用mov指令把下一次要用的参数move进去。返回指储存在eax里头。

这也一定程度上解释了为什么c convention call是反向压栈,这样编译器处理起来方便,特别对于这些va_list,因为va_list后面不能继续跟参数,va_list一定出现在函数的末尾,如果是对printf这类的函数使用pascal call,也就是参数正向压栈,汇编级别处理起来就特别麻烦了。

下面就用汇编语言写一个调用printf,并用gdb跟踪寄存器。

代码test_printf.s

.section .data            
    format: .asciz "%d\n" 
.section .text    
.global _start    
_start:            
    pushl $12            
    pushl $format         
    call printf         
    movl $0, (%esp)            
    call exit

 
编译
#as -g test_printf.s -o test_printf.o

链接

#ld -lc -I /lib/ld-linux.so.2 test_printf.o -o test_printf

-g是要加入调试信息

ld的-lc是链接libc.a,-I是--dynamic-linker,/lib/ld-linux.so.2

运行

#./test_printf

输出12

调试

用objdump看看test_printf里头的.text section,注意Disassembly of section .text

使用gdb跟踪,看看上述是否正确

#gdb test_printf

设置断点到_start

(gdb) break _start

(gdb) run

执行,遇到断点,停下,eip指着第6行,也就是第一条要执行的push指令

(gdb) info reg

察看寄存器状况

(gdb) s

执行一步,eip指着下一条指令地址

(gdb) info reg

esp 0xbffff6cc 0xbffff6cc

6cc = 6d0 - 4,对比上一条的esp,小了4,也就是stack增长了4个字节

(gdb) s

(gdb) info reg

esp 0xbffff6c8 0xbffff6c8

6c8 = 6cc - 4,对比上一条的esp,小了4,也就是stack增长了4个字节

(gdb) s

in printf () from /lib/libc.so.6

执行一步,正式进入printf

(gdb) info reg

esp 0xbffff6c4 0xbffff6c4

6c4=6c8-4 新push进去4个字节

(gdb) x /1x $esp
0xbffff6c4: 0x080481c4

esp的栈顶保存的是下一条要执行的代码的位置,movl的位置,(参考上面objdump的结果)

可以使用bt查看栈帧,下面对比栈变化

(gdb) s

printf出12,已经执行完毕

(gdb) info reg

eax保存着这次printf的返回值,也就是被打印的字符数量,12\n,一共3个字符。

esp恢复到call printf之前的状态

恢复eip

(gdb) s

执行movl指令,下一条是call exit

(gdb) x /1x $esp

esp并没有增长,因为printf之前的数据已经没用了,我没有把他们pop出来,而是直接用新的数据刷写esp所指的内存。

(gdb) s
(gdb) s

正常退出

关于EIP、ESP、EBP寄存器

1.EIP寄存器里存储的是CPU下次要执行的指令的地址。

也就是调用完fun函数后,让CPU知道应该执行main函数中的printf("函数调用结束")语句了。

2.EBP寄存器里存储的是是栈的栈底指针,通常叫栈基址这个是一开始进行fun()函数调用之前,由ESP传递给EBP的。(在函数调用前你可以这么理解:ESP存储的是栈顶地址,也是栈底地址。)

3.ESP寄存器里存储的是在调用函数fun()之后,栈的栈顶。并且始终指向栈顶。

堆栈是一种简单的数据结构,是一种只允许在其一端进行插入或删除的线性表。
允许插入或删除操作的一端称为栈顶,另一端称为栈底,对堆栈的插入和删除操作被称入栈和出栈。

有一组CPU指令可以实现对进程的内存实现堆栈访问。其中,POP指令实现出栈操作,PUSH指令实现入栈操作。
CPU的ESP寄存器存放当前线程的栈顶指针,
EBP寄存器中保存当前线程的栈底指针。
CPU的EIP寄存器存放下一个CPU指令存放的内存地址,当CPU执行完当前的指令后,从EIP寄存器中读取下一条指令的内存地址,然后继续执行。

 

参考:http://blog.csdn.net/feng_zh/article/details/7075986
————————————————
版权声明:本文为CSDN博主「unix21」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/unix21/article/details/8450155

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第1章 基本知识 1-1 汇编语言介绍 1-1-1 程序设计语言分类 1-1-2 汇编语言程序设计的意义 1-2 位及字节 1-3 二进制数 1-3-1 数字系统 1-3-2 补码 1-3-3 BCD码 1-4 十六进制表示法 1-5 ASCII码 1-6 个人计算机组成 1-6-1 处理器 1-6-2 内部存储器 1-6-3 段与地址 1-6-4 寄存器 1-7 硬件中断 课后习题 第2章 程序加载并执行 2-1 操作系统的组成 2-2 BIOS启动程序 2-3 系统加载程序 2-4 堆栈 课后习题 第3章 NASM汇编语言基础 3-1 源程序行格式 3-2 伪指令 3-2-1 定义含有初值的数据 3-2-2 定义不含初值的数据 3-2-3 INCBIN伪指令 3-2-4 EQU伪指令 3-2-5 TIMES伪指令 3-3 有效地址 3-4 常量 3-4-1 数字常量 3-4-2 字符常量 3-4-3 字符串常量 3-4-4 浮点数常量 3-5 表达式 3-5-1 OR运算符 3-5-2 XOR运算符 3-5-3 AND运算符 3-5-4 移位运算符 3-5-5 加及减运算符 3-5-6 乘及除运算符 3-5-7 单元运算符 3-6 临界表达式 3-7 局部标号 3-8 预处理器 3-8-1 %define指令 3-8-2 %undef指令 3-8-3 %assign指令 3-8-4 多行宏 3-8-5 条件汇编 3-8-6 预处理循环 3-8-7 文件引用指引 3-8-8 标准宏 3-8-9 汇编语言指引 3-9 目标文件格式 3-10 NASM汇编程序安装 3-11 范例 课后习题 第4章 一般指令 4-1 源操作数与目的操作数 4-2 MOV传送指令 4-3 XCHG互换指令 4-4 有效地址送寄存器指令LEA 4-5 指针送寄存器指令LDS及LES指令 4-6 压入PUSH及弹出POP指令 4-7 存储寄存器PUSHA及POPA指令 4-8 标志寄存器传送PUSHF及POPF指令 4-9 没有运算的NOP指令 课后习题 第5章 基本输入与输出 5-1 软件中断INT指令 5-2 将一个字符串输出到屏幕 5-3 从键盘输入一个字符 5-4 将一个字符输出到屏幕 5-5 从键盘输入一个字符串 5-6 将一个字输出到屏幕 5-7 显示内存内容 5-8 键盘输入控制 5-8-1 由键盘输入字符 5-8-2 直接由键盘输入或输出字符 5-8-3 直接由键盘输入字符 5-8-4 直接由键盘输入字符 5-8-5 由键盘输入字符串 5-8-6 检查键盘缓冲区 5-8-7 清除键盘缓冲区 5-8-8 从键盘缓冲区读取字符 5-8-9 测试键盘缓冲区是否有字符 5-8-10 传回控制键状态 5-9 屏幕输出控制 5-9-1 显示字符 5-9-2 显示字符串 5-9-3 设定光标位置 5-9-4 向上滚动屏幕 5-10 打印机输出控制 5-10-1 输出字符至打印机 5-10-2 打印一个字符 5-10-3 取得打印机状态 课后习题 第6章 程序流程控制 6-1 标志寄存器 6-2 改变标志的指令 6-3 条件转移指令 6-4 比较两个整数 6-5 无条件转移指令JMP 6-6 循环指令LOOP 6-7 选择结构 6-8 循环结构 课后习题 第7章 算术运算 7-1 定点数与浮点数 7-2 带符号及无符号整数 7-3 加法及减法 7-4 乘法 7-5 除法 7-6 BCD十进制数运算 7-6-1 BCD加法 7-6-2 BCD减法 7-6-3 BCD乘法 7-6-4 BCD除法 7-6-5 BCD宏应用 7-7 综合例题 课后习题 第8章 宏 8-1 单行宏 8-1-1 %define指令 8-1-2 %undef指令 8-1-3 %assign指令 8-2 多行宏 8-2-1 显示字符串宏 8-2-2 显示字符宏 8-2-3 读取字符宏 8-2-4 显示字节宏 8-2-5 读取字符串宏 8-2-6 字符串转换为数值 8-2-7 数值转换为字符串 8-2-8 数值输出至屏幕 8-3 条件汇编 8-4 预处理循环 8-5 源程序文件的包含内容 8-6 相关宏汇总 课后习题 第9章 过程 9-1 过程的定义 9-2 过程里的局部变量 9-3 传值调用 9-4 传址调用 9-5 堆栈传递参数 9-6 内存传递参数 课后习题 第10章 字符串处理 10-1 声明字符串 10-2 字符串长度 10-3 基本字符串指令 10-4 转换指令XLATB 10-5 字符串宏 课后习题 第11章 位运算 11-1 位基本运算 11-2 位屏蔽 11-3 AND指令 11-4 OR指令 11-5 XOR指令 11-6 NOT指令 11-7 TEST指令 11-8 改变位位置 11-9 左移及右移 11-10 算术左移及算术右移 11-11 循环位移 11-12 位移及循环位移指令总结 11-13 综合例题 课后习题 第12章 文件处理 12-1 输入及输出层次 12-2 输入及输出概念 12-3 标准的文件代号 12-4 建立一个文件代号 12-5 打开一个文件 12-6 关闭一个文件 12-7 从文件或设备读取数据 12-8 数据写入文件或设备 12-9 移动文件指针 12-10 检查并修改文件属性 12-11 建立新文件 12-12 删除文件 12-13 文件改名 12-14 建立或删除子目录 12-15 取得当前目录 12-16 改变当前目录 12-17 取得缺省的磁盘驱动器 12-18 改变缺省的磁盘驱动器 12-19 低级输入及输出 课后习题 第13章 数据结构 13-1 数组声明 13-2 数组查找 13-3 使用XLATB指令转换 13-4 排序 13-5 队列 13-6 堆栈 13-7 链表 课后习题 第14章 浮点数运算 14-1 80x87协处理器的运算 14-2 浮点堆栈 14-3 状态字 14-4 控制字 14-5 数据类型 14-5-1 二进制整数 14-5-2 聚集十进制数 14-5-3 实数 14-5-4 七种数据类型值的范围 14-6 80x87指令集 14-7 范例 课后习题 第15章 连接程序 15-1 建立NASM源程序 15-2 将目标文件连接成.exe文件 15-3 显示DOS的BIOS区域数据 15-4 系统设备数据 15-5 内存容量 课后习题 附录 NASM汇编语言指令

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值