GNU内嵌汇编 - C与汇编混合编程（一）

生活需要深度

已于 2022-03-20 09:21:38 修改

阅读量890

点赞数

文章标签：汇编 ARM 内嵌汇编

于 2022-02-28 15:33:22 首次发布

本文链接：https://blog.csdn.net/u012294613/article/details/123183866

版权

ARM与裸机开发专栏收录该内容

46 篇文章 22 订阅

订阅专栏

内嵌汇编语言是为了解决高级语言编译器的没有办法针对某些特定场景完成代码优化的目的，比方说锁机制。内嵌汇编中，通过将C语言变脸和汇编操作数之间的对应关系对应起来，汇编内部完成操作数据具体寄存器存储问题和具体功能实现将结果回传给C语言返回值，GCC编译器会自动完成必要的代码操作流程。

1. 格式

1.1. GNU内嵌汇编格式

asm volatile (
    “asm code”
    ：output
    ：input
    ：changed); 

__asm__ __violate__ 
("movl %1,%0" : "=r" (result) : "m" (input));

asm 内嵌汇编关键字，说明活便语句的开始，使用asm()将代码段括起来
volatile 告诉编译器不要优化内嵌汇编，如果想优化可以不加
内嵌汇编汇编中美个汇编语句都需要使用" "将语句括起来，内部包含部分是指令内容。
整体语句必须以‘;’结尾，不管有多长对C都只是一条语句。

ANSI C规范的关键字：（ANSI C把asm用于其它用途，不能用于内嵌汇编语句，GCC可以）
__asm__
　　__volatile__ //前面和后面都有两个下划线，它们之间没有空格、
如果后面部分没有内容，‘：’可以省略，前面或中间的不能省略‘：’没有asm code也不可以省略‘“”’，没有changed必须省略‘：’

1.2. asm code

asm code必须放在一个字符串内，但是字符串中间是不能直接按回车键换行的。可以写成多个字符串，只要字符串之间不加任何符号编译完后就会变成一个字符串。"mov r0,r0\n\t" //指令之间必须要换行，\t可以不加，只是为了在汇编文件中的指令格式对齐。

"mov r1,r1\n\t"
"mov r2,r2"
字符串内不是只能放指令，可以放一些标签、变量、循环、宏等等。还可以把内嵌汇编放在C函数外面，用内嵌汇编定义函数、变量、段等汇编有的东东，总之就跟直接在写汇编文件一样。在C函数外面定义内嵌汇编时不能加volatile：output：input：changed。
　　注意：编译器不检查asm code的内容是否合法，直接交给汇编器

1.3. output（ASM --> C）和input（C --> ASM）

__asm__ __volatile__ (
　　"asm code"
　　:“constraint”（variable）
);

1. 输出值

constraint定义variable的存放位置：
　　　　r　　　　　使用任何可用的通用寄存器
　　　　m 　　　　使用变量的内存地址

output修饰符：
　　　　　　　+ 　　　　可读可写
　　　　　　　= 　　　　只写
　　　　　　　　　　& 　　　　该输出操作数不能使用输入部分使用过的寄存器，只能 +& 或 =& 方式使用

　　2、指定输入值
　　　　__asm__ __volatile__ (
　　　　　　"asm code"
　　　　　　:
　　　　　　:“constraint”（variable / immediate）
　　　　);

　　　　constraint定义variable / immediate的存放位置：
　　　　　　　　　　r　　　　　使用任何可用的通用寄存器（变量和立即数都可以）
　　　　　　　　　　m 　　　　使用变量的内存地址（不能用立即数）
　　　　　　　　　　i　　　　　使用立即数（不能用变量）

　　3、使用占位符
　　　　int a = 100,b = 200;
　　　　int result;
　　　　__asm__ __volatile__ (
　　　　　　“mov %0,%3\n\t” //mov r3,#123 %0代表result，%3代表123（编译器会自动加 # 号）
　　　　　　“ldr r0,%1\n\t” //ldr r0,[fp, #-12] %1代表 a 的地址
　　　　　　“ldr r1,%2\n\t” //ldr r1,[fp, #-16] %2代表 b 的地址
　　　　　　“str r0,%2\n\t” //str r0,[fp, #-16] 因为%1和%2是地址所以只能用ldr或str指令
　　　　　　“str r1,%1\n\t” //str r1,[fp, #-12] 如果用错指令编译时不会报错，要到汇编时才会
　　　　　　：“=r”(result),“+m”(a),“+m”(b) out1是%0，out2是%1，...，outN是%N-1
　　　　　　：“i”(123) in1是%N，in2是%N+1，...
　　　　);

　　4、引用占位符
　　　　int num = 100;
　　　　__asm__ __volatile__ (
　　　　　　"add %0,%1,#100\n\t"
　　　　　　: "=r"(a)
　　　　　　: "0"(a) //"0"是零，即%0，引用时不可以加 %，只能input引用output,
　　　　); //引用是为了更能分清输出输入部分

　　5、 & 修饰符
　　　　int num;
　　　　__asm__ __volatile__ ( //mov r3, #123 //编译器自动加的指令
　　　　　　"mov %0,%1\n\t" //mov r3,r3 //输入和输出使用相同的寄存器
　　　　　　: "=r"(num)
　　　　　　: "r"(123)
　　　　);

　　　　int num;
　　　　__asm__ __volatile__ ( //mov r3, #123
　　　　　　"mov %0,%1\n\t" //mov r2,r3 //加了&后输入和输出的寄存器不一样了
　　　　　　: "=&r"(num) //mov r3, r2 //编译器自动加的指令
　　　　　　: "r"(123)
　　　　);

1.4. changed

　　告诉编译器你修改过的寄存器，编译器会自动把保存这些寄存器值的指令加在内嵌汇编之前，再把恢复寄存器值的指令加在内嵌汇编之后

void test()　　　　　　　　　　　　　　　　　　test:
{　　　　　　　　　　　　　　　　　　　　　　　　  str fp, [sp, #-4]!
　　 __asm__ __volatile__ (　　　　　　　　　　　add fp, sp, #0
　　　　"mov r4,#123"　　　　　　　　　　　　　　 mov r4,#123
　　 ); 　　　　　　　　　　　　　　　　　　　　　　add sp, fp, #0
} 　　　　　　　　　　　　　　　　　　　　　　　　 ldmfd sp!, {fp}
　　　　　　　　　　　　　　　　　　　　　　　　    bx lr

void test()　　　　　　　　　　　　　　　　　　test:
{　　　　　　　　　　　　　　　　　　　　　　　　　stmfd sp!, {r4, fp}
   __asm__ __volatile__ ( 　　　　　　　　　　　 add fp, sp, #0
 　"mov r4,#123"　　　　　　　　　　　　　　　　mov r4,#123
   : 　　　　　　　　　　　　　　　　　　　　　　  add sp, fp, #0
　 : 　　　　　　　　　　　　　　　　　　　　　　  ldmfd sp!, {r4, fp}
　 :"r4" 　　　　　　　　　　　　　　　　　　　　  bx lr
);
  }

　　汇编的第 2 行与第 6 行没有保存和恢复 R4（R4是通用寄存器变量必须保护，见APCS），第 10 行与第 14 行有保存和恢复 R4

　　如果修改了没有在输入或输出中定义的任何内存位置，必须在changed列表里加上“memory”

2. 实例说明

2.1. 内存复制

2.2. 锁实现

3. 限制字符含义汇总：

每个操作字前面双引号内的限制字符有很多种，有些是与特定体系结构相关，此处仅列出常用的限定字符和i386中可能用到的一些常用的限定符。它们的作用是指示编译器如何处理其后的 C 语言变量与指令操作数之间的关系。

分类    限定符   描述
通用寄存器    “a”    将输入变量放入eax
“b”    将输入变量放入ebx
“c”    将输入变量放入ecx
“d”    将输入变量放入edx
“s”    将输入变量放入esi
“d”    将输入变量放入edi
“q”    将输入变量放入eax，ebx，ecx，edx中的一个
“r”    将输入变量放入通用寄存器,即eax,ebx,ecx,edx,esi,edi之一
“A”    把eax和edx合成一个64 位的寄存器(use long longs)
内存    “m”    内存变量
“o”    操作数为内存变量，但其寻址方式是偏移量类型, 也即基址寻址
“V”    操作数为内存变量，但寻址方式不是偏移量类型
“ ”    操作数为内存变量，但寻址方式为自动增量
“p”    操作数是一个合法的内存地址（指针）
寄存器或内存    “g”    将输入变量放入eax，ebx，ecx，edx之一,或作为内存变量
“X”    操作数可以是任何类型
立即数    “I”    0-31之间的立即数（用于32位移位指令）
“J”    0-63之间的立即数（用于64位移位指令）
“N”    0-255之间的立即数（用于out指令）
“i”    立即数
“n”    立即数,有些系统不支持除字以外的立即数,则应使用“n”而非 “i”
匹配    “ 0 ”    表示用它限制的操作数与某个指定的操作数匹配
“1” ...   也即该操作数就是指定的那个操作数，例如“0”
“9”    去描述“％1”操作数，那么“%1”引用的其实就是“%0”操作数，注意作为限定符字母的0－9 与指令中的“％0”－“％9”的区别，前者描述操作数, 后者代表操作数。
&    该输出操作数不能使用过和输入操作数相同的寄存器
操作数类型    “=”    操作数在指令中是只写的（输出操作数）
“+”    操作数在指令中是读写类型的（输入输出操作数）
浮点数    “f”    浮点寄存器
“t”    第一个浮点寄存器
“u”    第二个浮点寄存器
“G”    标准的80387浮点常数
%    该操作数可以和下一个操作数交换位置,例如addl的两个操作数可以交换顺序（当然两个操作数都不能是立即数）
#    部分注释，从该字符到其后的逗号之间所有字母被忽略
*    表示如果选用寄存器，则其后的字母被忽略
2. 被更改资源列表：

有时在进行某些操作时，除了要用到进行数据输入和输出的寄存器外，还要使用多个寄存器来保存中间计算结果，这样就难免会破坏原有寄存器的内容。如果希望GCC在编译时能够将这一点考虑进去。那么你就可以在“破坏描述部分”声明这些寄存器或内存。
这种情况一般发生在一个寄存器出现在“汇编语句模板”，但却不是由输入或输出操作表达式所指定的，也不是在一些输入或输出操作表达式使用"r"、"g"约束时由GCC为其选择的，同时此寄存器被“汇编语句模板”中的指令修改，而这个寄存器只是供当前内嵌汇编临时使用的情况。比如：
__asm__("movl %0, %%ebx" : : "a"(foo) : "%ebx");
寄存器%ebx出现在“汇编语句模板”中，并且被movl指令修改，但却未被任何输入或输出操作表达式指定，所以你需要在“破坏描述部分”指定"%ebx"，以让GCC知道这一点。
因为你在输入或输出操作表达式所指定的寄存器，或当你为一些输入或输出操作表达式使用"r"、"g"约束，让GCC为你选择一个寄存器时，GCC对这些寄存器是非常清楚的——它知道这些寄存器是被修改的，你根本不需要在“破坏描述部分”再声明它们。但除此之外，GCC对剩下的寄存器中哪些会被当前的内嵌汇编修改一无所知。所以如果你真的在当前内嵌汇编语句中修改了它们，那么就最好“破坏描述部分”中声明它们，让GCC针对这些寄存器做相应的处理。否则有可能会造成寄存器的不一致，从而造成程序执行错误。
在“破坏描述部分”中指定这些寄存器的方法很简单，你只需要将寄存器的名字使用双引号引起来。如果有多个寄存器需要声明，你需要在任意两个声明之间用逗号隔开。比如：
__asm__("movl %0, %%ebx; popl %%ecx" : : "a"(foo) : "%ebx", "%ecx" );
注意准备在“破坏描述部分”声明的寄存器必须使用完整的寄存器名称，在寄存器名称前面使用的“%”是可选的。
另外需要注意的是，如果你在“破坏描述部分”声明了一个寄存器，那么这个寄存器将不能再被用做当前内嵌汇编语句的输入或输出操作表达式的寄存器约束，如果输入或输出操作表达式的寄存器约束被指定为"r"或"g"，GCC也不会选择已经被声明在“破坏描述部分”中的寄存器。比如：
__asm__("movl %0, %%ebx" : : "a"(foo) : "%eax", "%ebx");
此例中，由于输出操作表达式"a"(foo)的寄存器约束已经指定了%eax寄存器，那么再在“破坏描述部分”中指定"%eax"就是非法的。编译时，GCC会给出编译错误。

除了寄存器的内容会被改变，内存的内容也可以被修改。如果一个“汇编语句模板”中的指令对内存进行了修改，或者在此内嵌汇编出现的地方内存内容可能发生改变，而被改变的内存地址你没有在其输出操作表达式使用"m"约束，这种情况下你需要在“破坏描述部分”使用字符串"memory"向GCC声明：“在这里，内存发生了或可能发生了改变”。例如：
void * memset(void * s, char c, size_t count)
{undefined
__asm__("cld\n\t"
"rep\n\t"
"stosb"
: /* no output */
: "a"(c), "D"(s), "c"(count)
: "%ecx", "%edi", "memory");

return s;
}
此例实现了标准函数库memset，其内嵌汇编中的stosb对内存进行了改动，而其被修改的内存地址s被指定装入%edi，没有任何输出操作表达式使用了"m"约束，以指定内存地址s处的内容发生了改变。所以在其“破坏描述部分”使用"memory"向GCC声明：内存内容发生了变动。
如果一个内嵌汇编语句的“破坏描述部分”存在"memory"，那么GCC会保证在此内嵌汇编之前，如果某个内存的内容被装入了寄存器（通常因为编译器优化，会将某个内存处的变量缓存到某寄存器中来使用），那么在这个内嵌汇编之后，如果需要使用这个内存处的内容，就会直接到这个内存处重新读取，而不是使用被存放在寄存器中的拷贝。编译器在优化代码时，将内存的内容放到寄存器中去使用，而我们的内联汇编改变了该内存处的值，如果不告诉编译器，它是意识不到这一点的，就一直把寄存器中的内容当作内存内容来使用，这就与我们本来的意图不一致了。

当一个“汇编语句模板”中包含影响eflags寄存器中的条件标志，那么需要在“破坏描述部分”中使用"cc"来声明这一点。这些指令包括adc，div，popfl，btr，bts等等，另外，当包含call指令时，由于你不知道你所call的函数是否会修改条件标志，为了稳妥起见，最好也使用"cc"。