在Visual C++中编写内联汇编

最新推荐文章于 2023-10-26 21:12:00 发布

CodeCaptain

最新推荐文章于 2023-10-26 21:12:00 发布

阅读量473

点赞数 1

分类专栏：汇编 Visual C++ 文章标签：汇编

Visual C++ 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

汇编

2 篇文章 0 订阅

订阅专栏

一、内联汇编的优缺点

　　因为在Visual C++中使用内联汇编不需要额外的编译器和联接器，且可以处理Visual C++中不能处理的一些事情，而且可以使用在C/C++中的变量，所以非常方便。内联汇编主要用于如下场合:

　　1.使用汇编语言写函数；
　　2.对速度要求非常高的代码；
　　3.设备驱动程序中直接访问硬件；
　　4."Naked" Call的初始化和结束代码。

　　//(."Naked"，理解了意思，但是不知道怎么翻译^_^，大概就是不需要C/C++的编译器(自作聪明)生成的函数初始化和收尾代码，请参看MSDN的"Naked Functions"的说明)

　　内联汇编代码不易于移植，如果你的程序打算在不同类型的机器（比如x86和Alpha）上运行，应当尽量避免使用内联汇编。这时候你可以使用MASM，因为MASM支持更方便的的宏指令和数据指示符。

　　二、内联汇编关键字

　　在Visual C++使用内联汇编用到的是__asm关键字，这个关键字有两种使用方法:

　　1.简单__asm块

__asm
{
MOV AL, 2
MOV DX, 0XD007
OUT AL, DX
}

　　2.在每条汇编指令之前加__asm关键字

__asm MOV AL, 2
__asm MOV DX, 0xD007
__asm OUT AL, DX

　　因为__asm关键字是语句分隔符，因此你可以把汇编指令放在同一行:

　　__asm MOV AL, 2 __asm MOV DX, 0XD007 __asm OUT AL, DX

　　显然，第一种方法和C/C++的风格很一致，并且有很多其它优点，因此推荐使用第一种方法。

　　不象在C/C++中的"{}"，__asm块的"{}"不会影响C/C++变量的作用范围。同时，__asm块可以嵌套，嵌套也不会影响变量的作用范围。

　　三、在__asm块中使用汇编语言

　　1.内联汇编指令集

　　内联汇编完全支持的Intel 486指令集，允许使用MMX指令。不支持的指令可以使用_EMIT伪指令定义(_EMIT伪指令说明见下文)。

　　2.MASM表达式

　　内联汇编可以使用MASM中的表达式。比如: MOV EAX, 1。

　　3.数据指示符和操作符

　　虽然__asm块中允许使用C/C++的数据类型和对象，但它不能用MASM指示符和操作符定义数据对象。这里特别指出，__asm块中不允许MASM中的定义指示符: DB、DW、DD、DQ、DT和DF，也不允许DUP和THIS操作符。MASM结构和记录也不再有效，内联汇编不接受STRUC、RECORD、WIDTH或者MASK。

　　4.EVEN和ALIGN指示符

　　尽管内联汇编不支持大多数MASM指示符，但它支持EVEN和ALIGN，当需要的时候，这些指示符在汇编代码里面加入NOP(空操作)指令使标号对齐到特定边界。这样可以使某些处理器取指令时具有更高的效率。

　　5.MASM宏指示符

　　内联汇编不是宏汇编，不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏操作符(<>、!、&、%和.TYPE)。

　　6.段说明

　　必须使用寄存器来说明段，跨越段必须显式地说明，如ES:[BX]。

　　7.类型和变量大小

　　我们可以使用LENGTH来取得C/C++中的数组中的元素个数，如果不是一个数组，则结果为一。使用SIZE来取得C/C++中变量的大小，一个变量的大小是LENGTH和TYPE的乘积。TYPE用来取得一个变量的大小，如果是一个数组，它得到的一个数组中的单个元素的大小。

　　8.注释

　　可以使用C/C++的注释，但推荐用ASM的注释，即";"号。

　　9._EMIT伪指令

　　_EMIT伪指令相当于MASM中的DB，但一次只能定义一个字节，比如:

__asm
{
JMP _CodeOfAsm

_EMIT 0x00 ; 定义混合在代码段的数据
_EMIT 0x01

_CodeOfAsm:
; 这里是代码
_EMIT 0x90 ; NOP指令
}

四、在__asm块中使用C/C++语言元素

　　C/C++与汇编可以混合使用，在内联汇编可以使用C/C++的变量和很多其它C/C++的元素。在__asm块中可以使用以下C/C++元素:

　　1.符号，包括标号、变量和函数名；

　　2.常量，包括符号常量和枚举型(enum)成员；

　　3.宏定义和预处理指示符；

　　4.注释，包括""和"//"；

　　5.类型名，包括所有MASM中合法的类型

　　6.typedef名称，像PTR、TYPE、特定的结构成员或枚举成员这样的通用操作符。

　　在__asm块中，可以使用C/C++或ASM的基数计数法(比如: 0x100和100H是相等的)。

　　__asm块中不能使用像<<一类的C/C++操作符。C/C++和MASM通用的操作符，比如"*"和"[]"操作符，都被认为是汇编语言的操作符。举个例子:

int array[10];

__asm MOV array[6], BX ; Store BX at array+6 (not scaled)

array[6] = 0;

　　* 小技巧: 内联汇编中，你可以使用TYPE操作符使作其与C一致。比如，下面两条语句是一样的:

__asm MOV array[6 * TYPE int], 0 ; Store 0 at array + 12

array[6] = 0;

　　内联汇编能通过变两名直接引用C/C++的变量。__asm块中可以引用任何符号，包括变量名。

　　如果C/C++中的类、结构或者枚举成员具有唯一的名称，如果在"."操作符之前不指定变量或者typedef名称，则__asm块中只能引用成员名称。然而，如果成员不是唯一的，你必须在"."操作符之前加上变量名或typedef名称。例如，下面的两个结构都具有same_name这个成员变量:

struct first_type
{
char *weasel;
int same_name;
};

struct second_type
{
int wonton;
long same_name;
};

　　如果按下面声明变量:

struct first_type hal;
struct second_type oat;

　　那么，所有引用same_name成员的地方都必须使用变量名，因为same_name不是唯一的。另外，上面的weasel变量具有唯一的名称，你可以仅仅使用它的成员名称来引用它:

__asm
{
MOV EBX, OFFSET hal
MOV ECX, [EBX]hal.same_name ; 必须使用 'hal'
MOV ESI, [EBX].weasel ; 可以省略 'hal'
}

　　注意，省略了变量名仅仅是为了写代码的方便，生成的汇编指令的还是一样的。

　　可以不受限制地访问C++成员变量，但是不能调用C++的成员函数。

　　五、寄存器使用

　　一般来说，在__asm块开始的时候，寄存器是空的，不能在两个__asm之间保存寄存器的值。(这是MSDN上说的，我在实际使用时发现，好像并不是这样。不过它是说"一般"，我是特殊:))

　　如果一个函数被声明成了__fastcall，则其参数将放在寄存器中，这将给寄存器的管理带来问题。所以，如果要将一个函数声明成__fastcall，必须保存ECX寄存器。为了避免以上的冲突，在声明为__fastcall的函数中不要有__asm块。如果用了/Gr编译选项(它全局的变成__fastcall)，将每个函数声明成__cdecl或者__stdcall，这个属性告诉编译器用传统的C方法。

　　如果使用EAX、EBX、ECX、EDX、ESI和EDI寄存器，你不需要保存它；但如果你用到了DS、 SS、SP、BP和标志寄存器，那就应该PUSH保存这些寄存器。

　　如果程序中改变了用于STD和CLD的方向标志，你必须将其恢复到原来的值。

　　六、转跳

　　可以在C里面使用goto调到__asm块中的标号处，也可以在__asm块中转跳到__asm块里面和外面的标号处。__asm块内的标号是不区分大小写的(指令、指示符等也是不区分大小写的)。例:

void func()
{
goto C_Dest;
goto c_dest;

goto A_Dest;
goto a_dest;

__asm
{
JMP C_Dest ; 合法
JMP c_dest ; MSDN上说合法，但是我在VS.NET中编译，认为这样不合法

JMP A_Dest ; 合法
JMP a_dest ; 合法

a_dest: ; __asm 标号
}

C_Dest:
return;
}

　　不要使用函数名称当作标号，否则将使其跳到函数执行而不是标号处。如下所示:

; 错误: 使用函数名作为标号
JNE exit
.
.
.
exit:
; 下面是更多的ASM代码

　　美元符号$用于指定当前位置，如下所用，常用于条件跳转:

JNE $+5 ; 下面这条指令的长度是5个字节
JMP farlabel
;$+5，跳到了这里
.
.
.
farlabel:

七、调用函数

　　内联汇编调用C/C++函数必须自己清除堆栈，下面是一个调用C/C++函数例子:

#include

char szformat[] = "%s %s\n";
char szHello[] = "Hello";
char szWorld[] = " world";
void main()
{
__asm
{
MOV EAX, OFFSET szWorld
PUSH EAX
MOV EAX, OFFSET szHello
PUSH EAX
MOV EAX, OFFSET szformat
PUSH EAX
CALL printf

//内联汇编调用C函数必须自己清除堆栈
//用不使用的EBX寄存器清除堆栈，或ADD ESP, 12
POP EBX
POP EBX
POP EBX
}
}

　　注意:函数参数是从右向左压栈。

　　不能够访问C++中的类成员函数，但是可以访问extern "C"函数。

　　如果调用Windows API函数，则不需要自己清除堆栈，因为API的返回指令是RET n，会自动清除堆栈

　　比如下面的例子:

#include

char szAppName[] = "API Test";

void main()
{
char szHello[] = "Hello, world!";

__asm
{
PUSH MB_OK OR MB_ICONINformATION
PUSH OFFSET szAppName ; 全局变量用OFFSET
LEA EAX, szHello ; 局部变量用LEA
PUSH EAX
PUSH 0
CALL DWORD PTR [MessageBoxA] ; 注意这里，我费了好大周折才发现不是CALL MessageBoxA
}
}

　　一般来说，在Visual C++中使用内联汇编是为了提高速度，因此这些函数调用尽可能用C/C++写。

　　八、一个例子

　　下面的例子是在VS.NET(即VC7)中C语言写的。先建一个工程，将下列代码放到工程中的.c文件中编译，无需作特别的设置，即可编译通过。

//预处理
#include
///

///
//全局变量
HWND g_hWnd;
HINSTANCE g_hInst;

TCHAR szTemp[1024];

TCHAR szAppName[] = "CRC32 Sample";
/

/
//函数声明
DWORD GetCRC32(const BYTE *pbData, int nSize);
int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow);
LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam);
/

/
//主函数
int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow)
{
MSG msg;
WNDCLASSEX wndClassEx;

g_hInst = hInstance;

wndClassEx.cbSize = sizeof(WNDCLASSEX);
wndClassEx.style = CS_VREDRAW | CS_HREDRAW;
wndClassEx.lpfnWndProc = (WNDPROC) WindowProc;
wndClassEx.cbClsExtra = 0;
wndClassEx.cbWndExtra = 0;
wndClassEx.hInstance = g_hInst;
wndClassEx.hIcon = LoadIcon(NULL, IDI_APPLICATION);
wndClassEx.hCursor = LoadCursor(NULL, IDC_ARROW);
wndClassEx.hbrBackground = (HBRUSH) (COLOR_WINDOW);
wndClassEx.lpszMenuName = NULL;
wndClassEx.lpszClassName = szAppName;
wndClassEx.hIconSm = NULL;

RegisterClassEx(&wndClassEx);

g_hWnd = CreateWindowEx(0, szAppName, szAppName, WS_OVERLAPPED | WS_CAPTION | WS_SYSMENU | WS_THICKFRAME | WS_MINIMIZEBOX,
CW_USEDEFAULT, CW_USEDEFAULT, 300, 70,
NULL, NULL, g_hInst, NULL);

ShowWindow(g_hWnd, iCmdShow);
UpdateWindow(g_hWnd);

while (GetMessage(&msg, NULL, 0, 0))
{
TranslateMessage(&msg);
DispatchMessage(&msg);
}
return ((int) msg.wParam);
}
///

//
//主窗口回调函数
LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam)
{
switch (uMsg)
{
case WM_CREATE:
CreateWindowEx(WS_EX_CLIENTEDGE, "EDIT", NULL, WS_CHILD | WS_VISIBLE | WS_BORDER | ES_AUTOHSCROLL | ES_AUTOVSCROLL | ES_NOHIDESEL | WS_OVERLAPPED,
7, 12, 220, 22,
hWnd, (HMENU)1000, g_hInst, NULL);
CreateWindowEx(0, "BUTTON", "&OK", WS_CHILD | WS_VISIBLE | BS_PUSHBUTTON | WS_OVERLAPPED | BS_FLAT,
244, 12, 40, 20,
hWnd, (HMENU)IDOK, g_hInst, NULL);

break;

case WM_COMMAND:
switch (LOWORD(wParam))
{
case IDOK:
GetDlgItemText(g_hWnd, 1000, szTemp + 100, 800);
wsprintf(szTemp, "当前文本框内的字符串的CRC32校验码是: 0x%lX", GetCRC32(szTemp + 100, (int)strlen(szTemp + 100)));
MessageBox(g_hWnd, szTemp, szAppName, MB_OK|MB_ICONINformATION);
}
break;

case WM_DESTROY:
PostQuitMessage(0);
break;

default:
return (DefWindowProc(hWnd, uMsg, wParam, lParam));
}
return (0);
}
/

/
//GetCRC32: 求字节流的CRC32校验码
//参数:
// pbData: 指向字节流缓冲区首地址
// nSize: 字节流长度
//
//返回值:
// 字节流的CRC32校验码
//
//这里使用查表法求CRC32校验码，这部分是参考老罗的文章《矛与盾的较量（2）——CRC原理篇》该写的。
//原文的具体内容请参看: http://asp.7i24.com/netcool/laoluo/articles/show_article.asp?Article_ID=15
//
//下面使用内联汇编求CRC32校验码，充分使用了CPU中的寄存器，速度和方便性都是使用C/C++所不能比拟的
//
DWORD GetCRC32(const BYTE *pbData, int nSize)
{
DWORD dwCRC32Table[256];

__asm //这片内联汇编是初始化CRC32表
{
MOV ECX, 256

_NextTable:
LEA EAX, [ECX-1]
PUSH ECX
MOV ECX, 8

_NextBit:
SHR EAX, 1
JNC _NotCarry
XOR EAX, 0xEDB88320
_NotCarry:
DEC ECX
JNZ _NextBit

POP ECX
MOV [dwCRC32Table + ECX*4 - 4], EAX
DEC ECX
JNZ _NextTable
}

__asm //下面是求CRC32校验码
{
MOV EAX, -1
MOV EBX, pbData
OR EBX, EBX
JZ _Done
MOV ECX, nSize
OR ECX, ECX
JZ _Done

_NextByte:
MOV DL, [EBX]

XOR DL, AL
MOVZX EDX, DL
SHR EAX, 8
XOR EAX, [dwCRC32Table + EDX*4]

INC EBX
LOOP _NextByte
_Done:
NOT EAX
}
}