linux_c_note_05

目录

最简单的汇编程序

x86汇编的两种语法

x86的寄存器


  • 最简单的汇编程序


#PURPOSE: Simple program that exits and returns a
# status code back to the Linux kernel
#
#INPUT: none
#
#OUTPUT: returns a status code. This can be viewed
# by typing
#
# echo $?
#
# after running the program
#
#VARIABLES:
# %eax holds the system call number
# %ebx holds the return status
#
.section .data
.section .text
.globl _start
_start:
movl $1, %eax # this is the linux kernel command
        # number (system call) for exiting
        # a program
movl $4, %ebx # this is the status number we will
                # return to the operating system.
                # Change this around and it will
                # return different things to
            # echo $?
int $0x80 # this wakes up the kernel to run
            # the exit command

 

.section .data

汇编程序中以.开头的名称并不是指令的助记符,不会被翻译成机器指令,而是给汇编器一些特殊的指示,称为汇编指示(Assembler Directive) 或伪操作(Pseudo-operation) ,由于它不是真正的指令所以加个“伪”字。 .section指示把代码划分成若干个段(Section) ,程序被操作系统加载执行时,每个段被加载到不同的地址,具有不同的读、写、执行权限。 .data段保存程序的数据,是可读可写的, C程序的全局变量也属于.data段。本程序中没有定义数据,所以.data段是空的。

.section .text

.text段保存代码,是只读和可执行的,后面那些指令都属于这个.text段。

.globl _start

_start是一个符号(Symbol) ,符号在汇编程序中代表一个地址,可以用在指令中,汇编程序经过汇编器的处理之后,所有的符号都被替换成它所代表的地址值。

.globl指示告诉汇编器, _start这个符号要被链接器用到,所以要在目标文件的符号表中给它特殊标记。

_start就像C程序的main函数一样特殊,是整个程序的入口,链接器在链接时会查找目标文件中的_start符号代表的地址,把它设置为整个程序的入口地址,所以每个汇编程序都要提供一个_start符号并且用.globl声明。如果一个符号没有用.globl指示声明,就表示这个符号不会被链接器用到。

_start:

start在这里就像C语言的语句标号一样。汇编器在处理汇编程序时会计算每个数据对象和每条指令的地址,当汇编器看到这样一个标号时,就把它下面一条指令的地址作为_start这个符号所代表的地址。而_start这个符号又比较特殊,它所代表的地址是整个程序的入口地址,所以下一条指令movl $1, %eax就成了程序中第一条被执行的指令。

movl $1, %eax

这是一条数据传送指令, CPU内部产生一个数字1,然后传送到eax寄存器中。 mov后面的l表示long,说明是32位的传送指令。 CPU内部产生的数称为立即数(Immediate) ,在汇编程序中,立即数前面要加$,寄存器名前面要加%,以便跟符号名区分开。

movl $4, %ebx

和上一条指令类似,生成一个立即数4,传送到ebx寄存器中。

int $0x80

前两条指令都是为这条指令做准备的,执行这条指令时发生以下动作:

1. int指令称为软中断指令,可以用这条指令故意产生一个异常,异常的处理和中断类似, CPU从用户模式切换到特权模式,然后跳转到内核代码中执行异常处理程序。

2. int指令中的立即数0x80是一个参数,在异常处理程序中要根据这个参数决定如何处理,在Linux内核中, int $0x80这种异常称为系统调用(System Call) 。内核提供了很多系统服务供用户程序使用,但这些系统服务不能像库函数(比如printf)那样调用,因为在执行用户程序时CPU处于用户模式,不能直接调用内核函数,所以需要通过系统调用切换CPU模式,通过异常处理程序进入内核,用户程序只能通过寄存器传几个参数,之后就要按内核设计好的代码路线走,而不能由用户程序随心所欲,想调哪个内核函数就调哪个内核函数,这样保证了系统服务被安全地调用。在调用结束之后, CPU再切换回用户模式,继续执行int指令后面的指令,在用户程序看来就像函数的调用和返回一样。

3. eax和ebx寄存器的值是传递给系统调用的两个参数, eax的值是系统调用号, 1表示_exit系统调用, ebx的值则是传给_exit系统调用的参数,也就是退出状态。 _exit这个系统调用会终止掉当前进程,而不会返回它继续执行。以后我们会讲到其它系统调用,也是由int $0x80指令引发的, eax的值是系统调用的编号,不同的系统调用需要的参数个数也不同,比如有的需要ebx、 ecx、 edx三个寄存器的值做参数,大多数系统调用完成之后是会返回用户程序继续执行的,本例的_exit系统调用比较特殊。

  • x86汇编的两种语法

intel语法和AT&T语法,x86汇编一直存在两种不同的语法,在intel的官方文档中使用intel语法, Windows也使用intel语法,而UNIX平台的汇编器一直使用AT&T语法,所以本书使用AT&T语法。 mov %edx,%eax这条指令如果用intel语法来写,就是mov eax,edx,寄存器名不加%号,并且源操作数和目标操作数的位置互换。本书不详细讨论这两种语法之间的区别,读者可以参考[AssemblyHOWTO] :http://tldp.org/HOWTO/Assembly-HOWTO/

 

  • x86的寄存器

x86的通用寄存器有eax、 ebx、 ecx、 edx、 edi、 esi。

x86的特殊寄存器有ebp、 esp、 eip、 eflags。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

002237

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值