C语言怎样嵌入汇编:
TIPS:在编译过程汇中,汇编代码块是原封不动地送到汇编语言编译阶段的。
一、为什么会用到汇编?
1.为了提高速度和效率。不过这种情况很少了,现在C/C++编译器的优化很厉害了。
2.为了实现某些C语言中不具备、但为不同的机器所特有的功能。这是主要原因。
3.为了利用通用的汇编语言例程。也常会遇到。
二、何时使用汇编?
第一种情况是,绝对没有其他方法可以使用。
第二种情况出现在某个C语言程序的执行时间必须减少的时候。
三、如何嵌入汇编?
【Turbo C】:
1.使用预处理程序的伪指令#asm和#endasm,#asm用来开始一个汇编程序块,而#endasm指令用于该块的结束。
示例:
mul(a,b)
int a,b;
{
#asm
mov ax,word ptr 8[bp]
imul ax word ptr 10[bp]
#endasm
}
2.使用asm语句
格式:asm<汇编语句>
示例:
mul(a,b)
int a,b;
{
asm mov ax,word ptr 8[bp]
asm imul ax word ptr 10[bp]
}
//注意:asm行后面没有分号
【Visual C++】:
格式:
__asm 汇编指令 [ ; ]
__asm { 汇编指令 } [ ; ]
asm前面是两条下划线,后面的方括号内容表示分号可有可无。
<示例1>
__asm mov al, 2
__asm mov dx, 0xD007
__asm out dx, al
<示例2>
__asm {
mov al, 2
mov dx, 0xD007
out dx, al
}
<示例3>
__asm mov al, 2 __asm mov dx, 0xD007 __asm out dx, al
<示例4>msdn里面的内容
/* POWER2.C */
#include <stdio.h>
int power2( int num, int power );
void main( void )
{
printf( "3 times 2 to the power of 5 is %d\n", power2( 3, 5) );
}
int power2( int num, int power )
{
__asm
{
mov eax, num ; Get first argument
mov ecx, power ; Get second argument
shl eax, cl ; EAX = EAX * ( 2 to the power of CL )
}
/* Return with result in EAX */
}
【GNU GCC】:
由于内容比较多,所以简单说一下用到的关键字
“__asm__” 表示后面的代码为内嵌汇编,“asm”是“__asm__”的别名。
“__volatile__” 表示编译器不要优化代码,后面的指令保留原样,“volatile”是它的别名。
括号里面是汇编指令。
内嵌汇编语法如下:
__asm__(
汇编语句模板:
输出部分:
输入部分:
破坏描述部分)
一个简单的汇编模板:
<代码示例>
int a=10,b;
asm("movl %1, %%eax;
movl %%eax, %0;"
:"=r"(b) /*输出部*/
:"r"(a) /*输入部*/
:"%eax" /*修正部*/
);
表示C语言里的“b=a;”
里边r表示使用任意寄存器,%0、%1表示使用两个寄存器,一般只能%0~%9共十个操作数,按输入输出部变量出现顺序进行映射。
寄存器用两个百分号,是因为使用了%0%1这些数字使百分号有了特殊意义,所以在操作数出现的寄存器必须用双百分表示。
修正部里边的%eax表示eax寄存器在汇编代码块执行过程中会被改写,在执行前要保护好,这是提交给编译器决定的。
更多内容见《AT&T汇编语言与GCC内嵌汇编简介》
四:问题分析
void main()
{
__asm__("
jmp forward
backward:
popl %esi # Get the address of
# hello world string
movl $4, %eax # Do write system call
movl $2, %ebx
movl %esi, %ecx
movl $12, %edx
int $0x80
int3 # Breakpoint. Here the
# program will stop and
# give control back to
# the parent
forward:
call backward
.string "Hello World\n""
);
}
使用 gcc –o hello hello.c来编译它。编译不过,提示双引号没匹配!!
解答:我编译运行过了,下面修改过的代码是可以的,内联汇编有要求:
1、 指令必须包括在引号里。
2、 如果包含的指令超过一条,那么必须使用新行字符分割汇编语言代码的每一行。通常还包含制表符帮助缩进汇编语言代码,使代码更容易阅读。
需要第二个规格是因为编译器逐字的取得asm段中的汇编代码,并且把他们放在为程序生成的汇编代码中。每条汇编语言指令都必须在单独的一行中--因此需要包含新行字符。
【上机实练】※
用C写的程序效率可能不如汇编,而且有些平台相关的指令必须手写,例如x86是端口I/O,而c语言就没有这个概念,所以in/out指令必须用汇编来写。
①gcc提供了一种扩展写法可以在C代码中使用内联汇编,最简单的格式是__asm__("assembly code"); , 例如__asm__("nop"); ,nop这条指令让CPU空转一个周期,如果需要执行多条指令则用\n\t将各条指令隔开,例如:
__asm__("movl $1, %eax\n\t"
"movl $4, %ebx\n\t"
"int $0x80");
或者
__asm__("movl $1, %eax\n"
"movl $4, %ebx\n"
"int $0x80");
//visual code 环境测试可用
通常c代码中的内联汇编需要和c变量建立关联,需要用到完整的内联汇编样式:
__asm__(assembler template
: output operands /* optional */
: input operands /* optional */
: list of clobbered registers /* optional */
);
这种格式由四部分组成,第一部分是汇编指令,和上面的例子一样,第二部分和第三部分是约束条件,第二部分指示汇编指令的运算结果要输出到那些c操作数中,c操作数应该是左值表达式,第三部分指示汇编指令需要从那些c操作数获取输入,第四部分是在汇编指令中被修改过的寄存器列表,指示编译器哪些寄存器的值在执行这条__asm__语句时会改变。后三个部分都是可选的,如果没有就空着值写个":"号。