linux内核编程学习笔记一：AT&T汇编语言(转)

最新推荐文章于 2023-10-24 23:24:14 发布

weixin_33928467

最新推荐文章于 2023-10-24 23:24:14 发布

阅读量197

点赞数 1

文章标签： c/c++

原文链接：http://www.cnblogs.com/parrynee/archive/2010/01/12/1645194.html

版权

今天开始学习linux内核编程了，从没有内核编程基础开始学起。所以很多相关的知识都要了解。首先就是AT&T汇编语言。因为在linux内核源代码中，好像除了开始的bootsect.s和head.s是用intel的汇编外，别的汇编代码都是用的AT&T汇编语言，所以有必要把AT&T汇编语言了解一下。

不过，由于AT&T汇编和intel汇编大同小异，所以，了解一下一些不同的地方就可以了。

以下的内容都是AT&T汇编的特点：

1、寄存器前面要加“%”，如 mov %eax,%ebx

这里要注意的一点是，AT&T汇编中，源寄存器和目的寄存器的顺序和intel汇编刚好相反，AT&T汇编中，左边的是源寄存器，右边的是目的寄存器，在上边那个例子中，%eax是源寄存器，%ebx是目的寄存器。

2、立即数/常数前面要加$，如 mov $4,%ebx 把4这个数装入ebx这个寄存器。

符号常数直接用，如 mov value,%eax 即把value代表的那个值装入eax寄存器。

mov $value,%eax 即把value的值作为地址，而把对应那个地址中的值装入eax。

3、b(byte):8位， w（word）：16位， l（long）：32位

如： movb %al,%bl movw %ax,%bx movl %eax,%ebx

4、jum/call的操作数前要加上“*"作为前缀，远跳转ljmp，远调用lcall

如 ljmp $section,$offset

lcall $section,$offset

这里$section和offset表示的就是，以section为段地址，offset为段内偏移地址。因此，ljmp $section,$offset即跳转到section:offset地址。

5、远返回lret

如 lret $stack_adjust

6、寻址方式

寄存器间接寻址 AT&T: (%eax) Intel: [eax]

表示方式 section:disp(base,index,scale)

计算方法 base+index*scale+disp

即 section:[base+index*scale+disp]

其中disp是表示偏移地址。

如 movl -4(%ebp),%eax 把[%ebp-4]的内容装入eax

变址寻址 AT&T: _variable(%eax) Intel: [eax + _variable]

　　　　　 AT&T: _array(,%eax,4) Intel: [eax*4 + _array]
　　　　 AT&T: _array(%ebx,%eax,8) Intel: [ebx + eax*8 + _array]

7、C语言中嵌入汇编

格式: _asm_("asm statements":outputs:inputs:registers-modified)

其中，"asm statements"是汇编语句表达式，outputs,inputs,register-modified都是可选参数，以冒号隔开，且一次以0～9编号，如outputs的寄存器是0号，inputs寄存器是1号，往后依次类推。outputs是汇编语句执行完后输出到的寄存器，inputs是输入到某个寄存器。

例1：_asm_("pushl %%eax\n\t" "movl $0,%%eax\n\t" "popl %%eax");

在嵌入汇编中，寄存器前面要加两个%，因为gcc在编译是，会先去掉一个%再输出成汇编格式。

例2：{ register char _res;\

asm("push %%fs\n\t"

"movw %%ax,%%fs\n\t"

"movb %%fs:%1,%%al\n\t"

"pop %%fs"

:"=a"(_res):"0"(seg),"m"(*(addr)));\

_res;}

movb %%fs:%1,%%al\n\t一句中是把以fs为段地址，以后面的第二号寄存器即后面的seg中的值为偏移地址所对应的值装入al。"=a"(_res):"0"(seg),"m"(*(addr)))一句中，"=a"(_res)表示把a寄存器中的内容给_res，"0"(seg)表示把seg中的内容给0所对应的寄存器，而0即表示使用和前一个寄存器相同的寄存器，这里即使用a寄存器，也就是说把seg中的内容个a寄存器。

需要解释以下的是，a,b,c,d分别表示寄存器eax，ebx，ecx，edx

S，D分别表示寄存器esi，edi

r表示任意寄存器

0（数字0，不是o！）表示使用上一个寄存器

转载于:https://www.cnblogs.com/parrynee/archive/2010/01/12/1645194.html