GCC内嵌汇编之语法详解

最新推荐文章于 2024-09-20 16:21:42 发布

kunkliu

最新推荐文章于 2024-09-20 16:21:42 发布

阅读量567

点赞数 1

分类专栏： # gcc

原文链接：https://blog.csdn.net/qq_26093511/article/details/79546321

版权

gcc 专栏收录该内容

15 篇文章 3 订阅

订阅专栏

开发Arm程序的时候,大多数时候使用C/C++语言就可以了,但汇编语言在某些情况下能够实现一些C语言无法实现的功能,这时候就要调用一些汇编语言的程序.我们需要大概了解一下在C语言中如何嵌入汇编语言.

内嵌汇编语法如下：

        __asm__(汇编语句模板: 输出部分: 输入部分: 破坏描述部分)
共四个部分：汇编语句模板，输出部分，输入部分，破坏描述部分，各部分使用“:”格开，汇编语句模板必不可少，其他三部分可选，如果使用了后面的部分，而前面部分为空，也需要用“:”格开，相应部分内容为空。例如：
             __asm__ __volatile__("cli": : :"memory")

1、汇编语句模板
     汇编语句模板由汇编语句序列组成，语句之间使用“;”、“\n”或“\n\t”分开。指令中的操作数可以使用占位符引用C语言变量，操作数占位符最多10个，名称如下：%0，%1，…，%9。指令中使用占位符表示的操作数，总被视为 long型（4个字节），但对其施加的操作根据指令可以是字或者字节，当把操作数当作字或者字节使用时，默认为低字或者低字节。对字节操作可以显式的指明是低字节还是次字节。方法是在%和序号之间插入一个字母，“b”代表低字节，“h”代表高字节，例如：%h1 。

2、输出部分
     输出部分描述输出操作数，不同的操作数描述符之间用逗号格开，每个操作数描述符由限定字符串和C 语言变量组成。每个输出操作数的限定字符串必须包含“=”表示他是一个输出操作数。
例：
           __asm__ __volatile__("pushfl ; popl %0 ; cli":"=g" (x) )
描述符字符串表示对该变量的限制条件，这样GCC 就可以根据这些条件决定如何分配寄存器，如何产生必要的代码处理指令操作数与C表达式或C变量之间的联系。

3、输入部分
输入部分描述输入操作数，不同的操作数描述符之间使用逗号格开，每个操作数描述符由限定字符串和C语言表达式或者C语言变量组成。
例1 ：
             __asm__ __volatile__ ("lidt %0" : : "m" (real_mode_idt));
例二（bitops.h）：

Static __inline__ void __set_bit(int nr, volatile void * addr)
{
         __asm__(
                         "btsl %1,%0"
                         :"=m" (ADDR)
                         :"Ir" (nr));
}

后例功能是将(*addr)的第nr位设为1。第一个占位符%0与C 语言变量ADDR对应，第二个占位符%1与C语言变量nr对应。因此上面的汇编语句代码与下面的伪代码等价：btsl nr, ADDR，该指令的两个操作数不能全是内存变量，因此将nr的限定字符串指定为“Ir”，将nr 与立即数或者寄存器相关联，这样两个操作数中只有ADDR为内存变量。

4、限制字符
   4.1、限制字符列表
   限制字符有很多种，有些是与特定体系结构相关，此处仅列出常用的限定字符和i386中可能用到的一些常用的限定符。它们的作用是指示编译器如何处理其后的C语言变量与指令操作数之间的关系。

   分类             限定符                     描述
   通用寄存器       “a”               将输入变量放入eax
                                               这里有一个问题：假设eax已经被使用，那怎么办？
                                 其实很简单：因为GCC 知道eax 已经被使用，它在这段汇编代码
                                 的起始处插入一条语句pushl %eax，将eax 内容保存到堆栈，然
                                 后在这段代码结束处再增加一条语句popl %eax，恢复eax的内容
                   “b”               将输入变量放入ebx
“c”               将输入变量放入ecx
“d” 将输入变量放入edx
“s”               将输入变量放入esi
“d”               将输入变量放入edi
“q”               将输入变量放入eax，ebx，ecx，edx中的一个
                   “r”               将输入变量放入通用寄存器，也就是eax，ebx，ecx， edx，esi，edi中的一个
“A”               把eax和edx合成一个64 位的寄存器(use long longs)

       内存 “m”             内存变量
                     “o”             操作数为内存变量，但是其寻址方式是偏移量类型，
                                       也即是基址寻址，或者是基址加变址寻址
                     “V”             操作数为内存变量，但寻址方式不是偏移量类型
                     “ ”             操作数为内存变量，但寻址方式为自动增量
                     “p”             操作数是一个合法的内存地址（指针）

     寄存器或内存     “g”             将输入变量放入eax，ebx，ecx，edx中的一个
                                       或者作为内存变量
                       “X”             操作数可以是任何类型

     立即数
                     “I”             0-31之间的立即数（用于32位移位指令）
                       “J”             0-63之间的立即数（用于64位移位指令）
                     “N”             0-255之间的立即数（用于out指令）
                     “i”             立即数
                     “n”             立即数，有些系统不支持除字以外的立即数，
                                       这些系统应该使用“n”而不是“i”

     匹配             “ 0 ”，         表示用它限制的操作数与某个指定的操作数匹配，
                     “1” ...               也即该操作数就是指定的那个操作数，例如“0”
                       “9”             去描述“％1”操作数，那么“%1”引用的其实就
                                       是“%0”操作数，注意作为限定符字母的0－9 与
                                       指令中的“％0”－“％9”的区别，前者描述操作数，
                                       后者代表操作数。
                        & 该输出操作数不能使用过和输入操作数相同的寄存器

     操作数类型         “=”           操作数在指令中是只写的（输出操作数）
                        “+”           操作数在指令中是读写类型的（输入输出操作数）

     浮点数             “f”           浮点寄存器
                       “t”           第一个浮点寄存器
                       “u”           第二个浮点寄存器
                       “G”           标准的80387浮点常数
% 该操作数可以和下一个操作数交换位置
                                       例如addl的两个操作数可以交换顺序
                                       （当然两个操作数都不能是立即数）
                       #                   部分注释，从该字符到其后的逗号之间所有字母被忽略
                       *                     表示如果选用寄存器，则其后的字母被忽略

5、破坏描述部分

破坏描述符用于通知编译器我们使用了哪些寄存器或内存，由逗号格开的字符串组成，每个字符串描述一种情况，一般是寄存器名；除寄存器外还有“memory”。例如：“%eax”，“%ebx”，“memory”等。

转自：http://blog.chinaunix.net/uid-26941022-id-3202417.html

GCC内嵌汇编

刺猬@http://blog.csdn.net/littlehedgehog

AT&T手册里面的，我整理了下，方便阅读

内核代码绝大部分使用C 语言编写，只有一小部分使用汇编语言编写，例如与特定体系结构相关的代码和对性能影响很大的代码。GCC提供了内嵌汇编的功能，可以在C代码中直接内嵌汇编语言语句，大大方便了程序设计。

简单的内嵌汇编很容易理解
例如:

__asm____volatile__("hlt");

“__asm__”表示后面的代码为内嵌汇编，“asm”是“__asm__”的别名。
“__volatile__”表示编译器不要优化代码，后面的指令保留原样，
“volatile”是它的别名。括号里面是汇编指令。

使用内嵌汇编，要先编写汇编指令模板，然后将C语言表达式与指令的操作数相关联，并告诉GCC对这些操作有哪些限制条件。例如在下面的汇编语句：[下段解释一定要耐着性子看懂读懂！]

__asm__ __violate__ ("movl %1,%0" : "=r" (result) : "m" (input));

“movl %1,%0”是指令模板；“%0”和“%1”代表指令的操作数，称为占位符，内嵌汇编靠它们将C语言表达式与指令操作数相对应。指令模板后面用小括号括起来的是C语言表达式，本例中只有两个：“result”和“input”，他们按照出现的顺序分别与指令操作数“%0”，“%1，”对应；注意对应顺序：第一个C表达式对应“%0”；第二个表达式对应“%1”，依次类推，操作数至多有10个，分别用“%0”，“%1”….“%9，”表示。在每个操作数前面有一个用引号括起来的字符串，字符串的内容是对该操作数的限制或者说要求。“result”前面的限制字符串是“=r”，其中“=”表示“result”是输出操作数，“r”表示需要将“result”与某个通用寄存器相关联，先将操作数的值读入寄存器，然后在指令中使用相应寄存器，而不是“result”本身，当然指令执行完后需要将寄存器中的值存入变量“result”，从表面上看好像是指令直接对“result”进行操作，实际上GCC做了隐式处理，这样我们可以少写一些指令。“input”前面的“r”表示该表达式需要先放入某个寄存器，然后在指令中使用该寄存器参加运算。

下面来看看一个内嵌汇编的小例子:

extern int input,result;

void test(void )

{

input= 1;

__asm__ __volatile__ ("movl %1,%0" :

"=r" (result) : "r" (input));

return ;

}

对应的汇编代码如下;

行号代码解释

1
7
8 movl    $1, input                           对应C语言语句input = 1;
9 movl     input, %eax
10 #APP                                              GCC插入的注释，表示内嵌汇编开始
11 movl     %eax,%eax                     我们的内嵌汇编语句
12 #NO_APP                                      GCC 插入的注释，表示内嵌汇编结束
13 movl      %eax, result                  将结果存入result变量

从汇编代码可以看出，第9行和第13行是GCC，自动增加的代码，GCC 根据限定字符串决定如何处理C表达式，本例两个表达式都被指定为“r”型，所以先使用指令
movl input, %eax 将input读入寄存器%eax；

GCC，也指定一个寄存器与输出变量result 相关，本例也是%eax，等得到操作结果后再使用指令：

movl %eax, result

将寄存器的值写回C变量result中。从上面的汇编代码我们可以看出与result 和input，相关连的寄存器都是%eax，GCC使用%eax，替换内嵌汇编指令模板中的 %0，%1

movl %eax,%eax
显然这一句可以不要。但是没有优化，所以这一句没有被去掉。

由此可见，C表达式或者变量与寄存器的关系由GCC自动处理，我们只需使用限制字符串指导GCC 如何处理即可。限制字符必须与指令对操作数的要求相匹配，否则产生的汇编代码将会有错，读者可以将上例中的两个“r”，都改为“m”(m，表示操作数放在内存，而不是寄存器中)，编译后得到的结果是：

movl input, result

很明显这是一条非法指令，因此限制字符串必须与指令对操作数的要求匹配。例如指令movl允许寄存器到寄存器，立即数到寄存器等，但是不允许内存到内存的操作，因此两个操作数不能同时使用“m”作为限定字符。

由此我们可以总结出来内嵌汇编的格式:

我们来分别说明:

输出部分

输出部分描述输出操作数，不同的操作数描述符之间用逗号格开，每个操作数描述符由限定字符串和C语言变量组成。每个输出操作数的限定字符串必须包含“=”表示他是一个输出操作数。

例：

__asm__ __volatile__( "pushfl ; popl %0 ; cli":"=g" (x) )

描述符字符串表示对该变量的限制条件，这样GCC就可以根据这些条件决定如何分配寄存器，如何产生必要的代码处理指令操作数与C表达式或C变量之间的联系.

输入部分

输入部分描述输入操作数，不同的操作数描述符之间使用逗号格开，每个操作数描述符由限定字符串和C语言表达式或者C语言变量组成。

例如:

Static __inline__ void __set_bit(int nr, volatile void * addr)

{

__asm__(

"btsl %1,%0" :

"=m"(addr) :

"Ir"(nr)

);

}

该例子功能是将(*addr)的第nr位设为1。第一个占位符%0与C，语言变量ADDR对应，第二个占位符%1与C，语言变量nr对应。因此上面的汇编语句代码与下面的伪代码等价：
btsl nr, ADDR，该指令的两个操作数不能全是内存变量，因此将nr的限定字符串指定"lr"(下文会有解释)，与立即数或者寄存器相关联，这样两个操作数中只有ADDR为内存变量。

限制字符
限制字符有很多种，有些是与特定体系结构相关，此处仅列出常用的限定字符和i386中可能用到的一些常用的限定符。它们的作用是指示编译器如何处理其后的C语言变量与指令操作数之间的关系，例如是将变量放在寄存器中还是放在内存中等，下表列出了常用的限定字母。

“b”将输入变量放入ebx
“c”将输入变量放入ecx
“d”将输入变量放入edx
“s”将输入变量放入esi
“d”将输入变量放入edi
“q”将输入变量放入eax，ebx ,ecx ，edx中的一个
“r”将输入变量放入通用寄存器，也就是eax ，ebx，ecx,edx，esi，edi中的一个
“A”把eax和edx，合成一个64位的寄存器(uselong longs)
“m”内存变量
“o”操作数为内存变量，但是其寻址方式是偏移量类型，也即是基址寻址，或者是基址加变址寻址
“V”操作数为内存变量，但寻址方式不是偏移量类型
“,” 操作数为内存变量，但寻址方式为自动增量
“p”操作数是一个合法的内存地址（指针）


寄存器或内存

“g” 将输入变量放入eax，ebx，ecx ，edx中的一个或者作为内存变量
“X”操作数可以是任何类型


立即数
“I” 0-31 之间的立即数（用于32位移位指令）
“J” 0-63 之间的立即数（用于64 位移位指令）
“N” 0-255 ，之间的立即数（用于out 指令）
“i” 立即数
“n” 立即数，有些系统不支持除字以外的立即数，这些系统应该使用“n”而不是“i”


匹配

  "0"、"1" ....."9"
表示用它限制的操作数与某个指定的操作数匹配，也即该操作数就是指定的那个操作数，例如用“0 ”去描述“％1”操作数，那么“%1”引用的其实就是“%0”操作数，注意作为限定符字母的0－9 ，与指令中的“％0”－“％9”的区别，前者描述操作数，后者代表操作数。

操作数类型
“=” 操作数在指令中是只写的（输出操作数）
“+” 操作数在指令中是读写类型的（输入输出操作数）

   浮点数
“f”

浮点寄存器
“t”第一个浮点寄存器
“u”第二个浮点寄存器
“G”标准的80387

现在继续看上面的例子：
"=m" (ADDR)表示ADDR为内存变量（“m”），而且是输出变量（“=”）；"Ir" (nr)表示nr，为 0－31之间的立即数（“I”）或者一个寄存器操作数（“r”）。

匹配限制符是一位数字 "0"、"1" ....."9" , 分别表示它限制的C表达式分别与占位符%0，%1，……%9对应的C变量匹配。例如使用“0”作为%1，的限制字符，那么 %0和%1表示同一个C变量。
还是来看个例子吧:

extern int input,result;

void test_at_t()

{

result = 0;

input = 1;

__asm__

__volatile__ ("addl %2,%0":"=r"(result):"0"(result),"m"(input));

}

输入部分中的result用匹配限制符“0”限制，表示%1与％0，代表同一个变量，输入部分说明该变量的输入功能，输出部分说明该变量的输出功能，两者结合表示result, 是读写型。因为%0和%1，表示同一个C变量，所以放在相同的位置，无论是寄存器还是内存。

寄存器破坏描述符

通常编写程序只使用一种语言：高级语言或者汇编语言。高级语言编译的步骤大致如下：

预处理；
l
编译
l
汇编
l
链接

我们这里只关心第二步编译（将C代码转换成汇编代码）：因为所有的代码都是用高级语言编写，编译器可以识别各种语句的作用，在转换的过程中所有的寄存器都由编译器决定如何分配使用，它有能力保证寄存器的使用不会冲突；也可以利用寄存器作为变量的缓冲区，因为寄存器的访问速度比内存快很多倍。如果全部使用汇编语言则由程序员去控制寄存器的使用，只能靠程序员去保证寄存器使用的正确性。但是如果两种语言混用情况就变复杂了，因为内嵌的汇编代码可以直接使用寄存器，而编译器在转换的时候并不去检查内嵌的汇编代码使用了哪些寄存器（因为很难检测汇编指令使用了哪些寄存器，例如有些指令隐式修改寄存器，有时内嵌的汇编代码会调用其他子过程，而子过程也会修改寄存器），因此需要一种机制通知编译器我们使用了哪些寄存器（程序员自己知道内嵌汇编代码中使用了哪些寄存器），否则对这些寄存器的使用就有可能导致错误，修改描述部分可以起到这种作用。当然内嵌汇编的输入输出部分指明的寄存器或者指定为“r”，“g”型由编译器去分配的寄存器就不需要在破坏描述部分去描述，因为编译器已经知道了。

下面看个例子就很清楚为什么需要通知GCC内嵌汇编代码中隐式（称它为隐式是因为GCC并不知道）使用的寄存器。

在内嵌的汇编指令中可能会直接引用某些寄存器，我们已经知道AT&T格式的汇编语言中，寄存器名以“%”作为前缀，为了在生成的汇编程序中保留这个“%”号，在asm语句中对寄存器的引用必须用“%%”作为寄存器名称的前缀。原因是“%”在asm，内嵌汇编语句中的作用与“/”在C语言中的作用相同，因此“%%”转换后代表“%”。

int main(void )

{

int input, output,temp;

input = 1;

__asm__ __volatile__ ("movl $0, %%eax;

movl %%eax, %1;

movl %2, %%eax;

movl %%eax, %0; "

:"=m"(output),"=m"(temp) /* output */

:"r"(input) /* input */

);

return 0;

}

这段代码使用%eax作为临时寄存器，功能相当于C代码：“temp = 0;output=input”，
对应的汇编代码如下：

         movl $1,-4(%ebp)
         movl -4(%ebp),%eax /APP
         movl $0, %eax;
        movl %eax, -12(%ebp);
         movl %eax, %eax;
         movl %eax, -8(%ebp);       /NO_APP

显然GCC给input分配的寄存器也是%eax，发生了冲突，output的值始终为0，而不是input。

使用破坏描述后的代码：

int main(void )

{

int input, output,temp;

input = 1;

__asm__ __volatile__

( "movl $0, %%eax;

movl %%eax, %1;

movl %2, %%eax;

movl %%eax, %0; "

:"=m"(output),"=m"(temp) /* output */

:"r"(input) /* input */

:"eax"); /* 描述符 */

return 0;

}

对应的汇编代码：

         movl $1,-4(%ebp)
         movl -4(%ebp),%edx            //APP
         movl $0, %eax;
         movl %eax, -12(%ebp);
         movl %edx, %eax;
         movl %eax, -8(%ebp);         /NO_APP


通过破坏描述部分，GCC得知%eax已被使用，因此给input分配了%edx。在使用内嵌汇编时请记住一点：尽量告诉GCC尽可能多的信息，以防出错。