在 VC++ 中使用 内联汇编

 

From:https://blog.csdn.net/root19881111/article/details/8450266

VC++内联汇编(MSDN相关内容完整翻译):http://www.cppblog.com/xingkongyun/archive/2008/12/21/70003.html

调 call 和 偷功能 时,VC中内联汇编容易产生的错误https://www.52pojie.cn/thread-977599-1-1.html

 

内联汇编 视频教程:https://edu.51cto.com/center/course/lesson/index?id=90306

在VC++中使用内联汇编:http://blog.sina.com.cn/s/blog_856d6d130102uzje.html

 

C++ 参数传递方式和压栈

 

 

一、内联汇编的优缺点

 

  因为在Visual C++中使用内联汇编不需要额外的编译器和联接器,且可以处理Visual C++中不能处理的一些事情,而且可以使用在C/C++中的变量,所以非常方便。内联汇编主要用于如下场合: 

  •   1. 使用汇编语言写函数;
  •   2. 对速度要求非常高的代码;
  •   3. 设备驱动程序中直接访问硬件;
  •   4. "Naked" Call 的初始化和结束代码。//(."Naked",理解了意思,但是不知道怎么翻译^_^,大概就是不需要C/C++的编译器(自作聪明)生成的函数初始化和收尾代码,请参看MSDN的"Naked <I>function</I>s"的说明)

内联汇编代码不易于移植,如果你的程序打算在不同类型的机器(比如x86和Alpha)上运行,应当尽量避免使用内联汇编。这时候你可以使用MASM,因为MASM支持更方便的的宏指令和数据指示符。

 

 

二、内联汇编关键字

 

  在Visual C++使用内联汇编用到的是__asm关键字,这个关键字有两种使用方法: 

  • 1.简单__asm块 ( 推荐这种方法写 内联汇编代码
__asm 
{ 
    MOV   AL, 2 
    MOV   DX, 0xD007 
    OUT   AL, DX 
}
  • 2.在每条汇编指令之前加__asm关键字 
__asm MOV   AL, 2 
__asm MOV   DX, 0xD007 
__asm OUT   AL, DX 

因为__asm关键字是语句分隔符,因此你可以把汇编指令放在同一行: 

__asm MOV AL, 2   __asm MOV DX, 0XD007   __asm OUT AL, DX 

显然,第一种方法和 C/C++ 的风格很一致,并且有很多其它优点,因此推荐使用第一种方法。 

不象在C/C++中的 "{}" ,__asm块的 "{}" 不会影响 C/C++ 变量的作用范围。同时,__asm块可以嵌套,嵌套也不会影响变量的作用范围。

 

 

三、在 __asm块中使用汇编语言

 

  • 1.内联汇编指令集 :内联汇编完全支持的Intel 486指令集,允许使用MMX指令。不支持的指令可以使用_EMIT伪指令定义(_EMIT伪指令说明见下文)。 
  • 2.MASM表达式 :内联汇编可以使用MASM中的表达式。比如: MOV EAX, 1。 
  • 3.数据指示符和操作符 :虽然__asm块中允许使用C/C++的数据类型和对象,但它不能用MASM指示符和操作符定义数据对象。这里特别指出,__asm块中不允许MASM中 的定义指示符: DB、DW、DD、DQ、DT和DF,也不允许DUP和THIS操作符。MASM结构和记录也不再有效,内联汇编不接受STRUC、RECORD、 WIDTH或者MASK。 
  • 4.EVEN和ALIGN指示符 :尽管内联汇编不支持大多数MASM指示符,但它支持EVEN和ALIGN,当需要的时候,这些指示符在汇编代码里面加入NOP(空操作)指令使标号对齐到特定边界。这样可以使某些处理器取指令时具有更高的效率。 
  • 5.MASM宏指示符 :内联汇编不是宏汇编,不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏操作符(<>、!、&、%和.TYPE)。 
  • 6.段说明 :必须使用寄存器来说明段,跨越段必须显式地说明,如ES:[BX]。 
  • 7.类型和变量大小 :我们可以使用LENGTH来取得C/C++中的数组中的元素个数,如果不是一个数组,则结果为一。使用SIZE来取得C/C++中变量的大小,一个变量的 大小是LENGTH和TYPE的乘积。TYPE用来取得一个变量的大小,如果是一个数组,它得到的一个数组中的单个元素的大小。 
  • 8.注释 :可以使用C/C++的注释,但推荐用ASM的注释,即";"号。 
  • 9._EMIT伪指令 :_EMIT伪指令相当于MASM中的DB,但一次只能定义一个字节,比如: 
    __asm
    { 
        JMP   _CodeOfAsm 
        _EMIT   0x00   ; 定义混合在代码段的数据 
        _EMIT   0x01 
        _CodeOfAsm: 
        ; 这里是代码 
        _EMIT   0x90   ; NOP指令 
    }

     

 

四、在 __asm块中使用 C/C++ 语言元素

 

C/C++与汇编可以混合使用,在内联汇编可以使用 C/C++ 的变量和很多其它C/C++的元素。

在__asm块中可以使用以下C/C++元素: 

  • 1.符号,包括标号、变量和函数名; 
  • 2.常量,包括符号常量和枚举型(enum)成员; 
  • 3.宏定义和预处理指示符; 
  • 4.注释,包括"/**/"和"//"; 
  • 5.类型名,包括所有MASM中合法的类型 
  • 6.typedef 名称, 像PTR、TYPE、特定的结构成员或枚举成员这样的通用操作符。 

在 __asm块中,可以使用 C/C++ 或 ASM 的基数计数法(比如: 0x100和100H是相等的)。 
__asm块中不能使用像 << 一类的C/C++操作符。C/C++和MASM通用的操作符,比如 "*" 和 "[]" 操作符,都被认为是汇编语言的操作符。举个例子: 

示例 1:

#include <iostream>
using namespace std;

int main()
{
	int array[10] = {0};        // 定义 int 类型 数组,全部初始化为0,每个大小都是 4 字节

	__asm 
	{
		mov eax, 0x10        ; 寄存器 eax 存储 0x10, 十进制 为 16
		mov array[36], eax   ; 存储 EBX寄存器中的值 到 array + 36 (not scaled)	
	}
	
	cout << array[9] << endl;   // 汇编 __asm mov array[36], eax 是把 eax 内容存到 array 第9个位置
	//cout << "Hello World!\n";
	//cout << 7% -3 << endl;
}

示例 2:

#include <iostream>
using namespace std;

int main()
{
	int array[10] = {0};        // 定义 int 类型 数组,全部初始化为0,每个大小都是 4 字节

	__asm mov eax, 0x10          ; 寄存器 eax 存储 0x10,十进制 为 16
	__asm mov array[36], eax     ; 存储 EBX寄存器中的值 到 array + 36 (not scaled)
	//array [6] = 0;             /* 存储 0 at array+12 (scaled) */

	cout << array[9] << endl;   // 汇编 __asm mov array[36], eax 是把 eax 内容存到 array 第9个位置
	//cout << "Hello World!\n";
	//cout << 7% -3 << endl;
}

* 小技巧: 内联汇编中,你可以使用 TYPE 操作符使作其与C一致。比如,下面两条语句是一样的: 

#include <iostream>
using namespace std;

int main()
{
	int array[10] = {0};      
	__asm 
	{
		mov eax, 0x10
		mov array[6 * TYPE int], eax	
	}
	cout << array[6] << endl;   
}

内联汇编能通过变两名直接引用C/C++的变量。__asm块中可以引用任何符号,包括变量名。 

如果C/C++中的类、结构或者枚举成员具有唯一的名称,如果在"."操作符之前不指定变量或者typedef名称,则__asm块中只能引用成员名称。 然而,如果成员不是唯一的,你必须在"."操作符之前加上变量名或typedef名称。例如,下面的两个结构都具有same_name 这个成员变量: 

struct first_type 
{ 
    char *weasel; 
    int same_name; 
}; 


struct second_type 
{ 
    int wonton; 
    long same_name; 
}; 

如果按下面声明变量: 

struct first_type hal; 
struct second_type oat; 

那么,所有引用 same_name 成员的地方都必须使用变量名,因为 same_name 不是唯一的。另外,上面的 weasel 变量具有唯一的名称,你可以仅仅使用它的成员名称来引用它: 

__asm 
{ 
    MOV EBX, OFFSET hal 
    MOV ECX, [EBX]hal.same_name ; 必须使用 'hal'
    MOV ESI, [EBX].weasel       ; 可以省略 'hal'
}

注意,省略了变量名仅仅是为了写代码的方便,生成的汇编指令的还是一样的。 可以不受限制地访问C++成员变量,但是不能调用C++的成员函数。

 

 

五、寄存器使用

 

  一般来说,在__asm块开始的时候,寄存器是空的,不能在两个__asm之间保存寄存器的值。(这是MSDN上说的,我在实际使用时发现,好像并不是这样。不过它是说"一般",我是特殊:)) 


如果一个函数被声明成了__fastcall,则其参数将放在寄存器中,这将给寄存器的管理带来问题。所以,如果要将一个函数声明成 __fastcall,必须保存ECX寄存器。为了避免以上的冲突,在声明为__fastcall的函数中不要有__asm块。如果用了/Gr编译选项 (它全局的变成__fastcall),将每个函数声明成__cdecl或者__stdcall,这个属性告诉编译器用传统的C方法。 


如果使用EAX、EBX、ECX、EDX、ESI和EDI寄存器,你不需要保存它;但如果你用到了DS、 SS、SP、BP和标志寄存器,那就应该PUSH保存这些寄存器。 


如果程序中改变了用于STD和CLD的方向标志,你必须将其恢复到原来的值。

 

 

六、转跳

 

可以在 C 里面使用 goto 调到 __asm 块中的标号处,也可以在 __asm 块中转跳到 __asm 块里面和外面的标号处。

__asm 块内的标号 不区分大小写  ( 指令、指示符等也是不区分大小写的 ) 。例: 

void func() 
{ 
    goto C_Dest;   /* 合法 */ 
    goto c_dest;   /* 错误 */ 

    goto A_Dest;   /* 合法 */ 
    goto a_dest;   /* 合法 */ 


    __asm 
    { 
        JMP C_Dest ; 合法
        JMP c_dest ; MSDN上说合法,但是我在VS.NET中编译,认为这样不合法

        JMP A_Dest ; 合法
        JMP a_dest ; 合法
        a_dest:    ; __asm 标号 
    }

    C_Dest:   /* C的标号 */ 
    return; 
} 

不要使用函数名称当作标号,否则将使其跳到函数执行而不是标号处。如下所示: 

JNE exit  ; 错误: 使用函数名作为标号 
; 下面是更多的ASM代码 
nop
nop
nop
exit:
nop 
; 下面是更多的ASM代码 

美元符号 $ 用于指定当前位置,如下所用,常用于条件跳转: 

JNE $+5 ; 下面这条指令的长度是5个字节 
JMP farlabel 
;$+5,跳到了这里 
. 
. 
. 
farlabel: 

 

 

七、调用函数

 

  内联汇编调用C/C++函数必须自己清除堆栈,下面是一个调用C/C++函数例子: 

C 代码使用的是 __cdecl 约定,需要调用者手动平衡堆栈,所以下面的代码的代码有 3个 pop ebx,也可以 add esp, 12

#include <stdio.h> 

char szformat[] = "%s %s\n"; 
char szHello[] = "Hello"; 
char szWorld[] = " world"; 

void main() 
{ 
    __asm 
    { 
        MOV   EAX, OFFSET szWorld 
        PUSH   EAX 
        MOV   EAX, OFFSET szHello 
        PUSH   EAX 
        MOV   EAX, OFFSET szformat 
        PUSH   EAX 
        CALL   printf 


        //内联汇编调用C函数必须自己清除堆栈 
        //用不使用的EBX寄存器清除堆栈,或ADD ESP, 12 
        POP   EBX 
        POP   EBX 
        POP   EBX 
    } 
} 

 

注意:函数参数是从右向左压栈。 不能够访问C++中的类成员函数,但是可以访问 extern "C" 函数。 如果调用 Windows API 函数,则不需要自己清除堆栈,因为API的返回指令是 RET n,会自动清除堆栈 。比如下面的例子: 

#include <windows.h> 

char szAppName[] = "API Test";


void main()
{
    char szHello[] = "Hello, world!";

    __asm
    {
        PUSH   MB_OK OR MB_ICONINFORMATION
        PUSH   OFFSET szAppName; 全局变量用OFFSET

        LEA   EAX, szHello; 局部变量用LEA
        ; 或者
        ; LEA   EAX, [szHello]; 局部变量用LEA
        ; lea是将一个地址装入寄存中,mov是将值放入寄存器中,
        ; [] 是用来取地址内容(中间包含的值是一个地址),相当C语言中的* p

        PUSH   EAX
        PUSH   0
        CALL   DWORD PTR[MessageBoxA]; 注意这里,我费了好大周折才发现不是CALL MessageBoxA
    }
}

或者:

#include <windows.h>


TCHAR appname[] = TEXT("API Test");


void main()
{
    TCHAR tszHello[] = TEXT("hello,word");
    __asm
    {
        PUSH MB_OK OR MB_ICONINFORMATION
        PUSH OFFSET appname
        LEA  EAX, tszHello
        PUSH EAX
        PUSH 0
        CALL DWORD PTR[MessageBoxW]//这个地方
        ; 注意这里不是 MessageBoxW, 而是重定位过的函数地址
    }
}

在汇编查找代码小技巧:加花指令

_asm
{
    //查找命令序列
    mov edi, edi
    mov edi, edi
}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值