实现通用化DLL调用模块的设计解析

最新推荐文章于 2024-03-13 16:10:40 发布

勤奋的攻城狮

最新推荐文章于 2024-03-13 16:10:40 发布

阅读量658

点赞数 1

本文链接：https://blog.csdn.net/cz_jjq/article/details/78390626

版权

Linux 同时被 3 个专栏收录

11 篇文章 0 订阅

订阅专栏

C++

7 篇文章 0 订阅

订阅专栏

Windows

5 篇文章 0 订阅

订阅专栏

实现通用化DLL调用模块的设计解析

注：本文为原创，请勿转载

##前言

一般在windows下使用C++调用dll的常见方式有：

静态调用 – 通过.h+.lib的方式实现
动态调用 – 通过函数声明+GetProcessAddress的方式实现

上述两种方式非常常见，也能够实现绝大多数的功能需求，两者的共性都是需要有函数声明（.h文件）才能去调用DLL中的函数。从本质上来说，上述方案都需要提供函数声明信息来支持C++编译器的静态编译过程。

但是，有些需求是无法在编译时就能确定函数声明信息的，例如需求是实现一种解释脚本及脚本解析器，其功能需求之一是需要能够动态执行外部的dll的函数。也就是说需要在程序实时运行过程中来动态确定函数的参数及参数类型、参数数量、函数的返回值及类型。

要实现这样的解释脚本解析器，上述静态调用和动态调用的静态声明+静态编译的方式基本上是行不通的，我们需要能够实现“动态声明”+"动态编译"的方案。

而“动态声明”+"动态编译"的解决方案，也正是本文讨论的内容。

阅读本文需要具备如下基础知识和技能：

C++11语法知识（及以上）
windows平台API使用&开发常识
WindowsDll开发常识
VisualStudio2015使用
VisualStudio2015 x86inline_asm和x64inline_asm的使用
汇编语言基础知识
动态调用 – 通过函数声明+GetProcessAddress的方式实现

我的最终设计目标是：开发出一个跨平台的库函数调用器，本文主要讲Windows x64部分。x86部分的设计可以参考该文章：在无函数声明的情况下运行时动态调用DLL函数。

工作环境选择

我个人比较愿意接受新事物，以往都工作于Linux下，经综合考虑之后，在Windows下开发环境选择如下：

项目	内容	备注
Windows版本	Win10 x64专业版	追赶潮流
开发工具	VisualStdio2015	C++11&14
C++编译器	VC C++ 14	理由是在Windows
asm编译器	VS2015自带的masm （ml64）	理由是在Windows
构建工具	cmake	跨平台

msvc在编译为x86时支持内联汇编，但在编译为x64时只支持.asm文件。也就是说x86和x64在汇编部分的实现是完全不同的。
ml64很多伪指令不支持，典型的比如invoke、.if 、.elseif 等等。
如果汇编部分考虑跨平台，则应该使用nasm编译器，同样支持inter汇编格式（2018.12.11更新）。

基础知识精炼

###函数调用约定

特别注意：x86和x64下的函数调用约定存在非常大的区别！！

####x86下的调用约定列表

约定类型	内容
__stdcall	参数从右到左入栈，调用的API负责栈指针（ESP）的恢复
__cdecl	参数从右到左入栈，API的调用者负责栈指针（ESP）的恢复
*__fastcall	Pascal ，参数入栈顺序时自左向右
_thiscall	面向对象时使用

__fastcall和__thiscall都不在本文考虑范围内。

####x64下的调用约定列表

约定类型	备注
__stdcall	参数从右到左入栈，API的调用者负责栈空间（RSP）的分配与回收
__cdecl	参数从右到左入栈，API的调用者负责栈空间（RSP）的分配与回收

可以看到，与x86不同，在x64下__stdcall和__cdecl没什么差别。

###C++函数调用

在C++中调用DLL中的函数和调用当前项目中的函数没有区别，都需要如下基础信息：
目标函数的地址
目标函数参数类型、数量
目标函数返回值

在整个实现过程中我都是用当前项目中的函数进行调试，成功后才使用DLL验证以下，所有测试用例也基于本地函数。 —— [ 维基百科 ]

###asm函数调用

实现本文的需求时，对汇编要求并不高，x86下将所有数据视为dword；x64下直接将所有数据视为qword.

####x86
在32位汇编中，我们调用一个API时，如果采用的是stdcall，它有两个特点：一是所有参数入栈，通过椎栈传递；二是被调用的API负责栈指针（ESP）的恢复。但如果采用cdecl，则由API的调用者负责堆栈指针的恢复。

####x64

x64首先把x86原有的寄存器扩展到了64位，然后更增加了8个通用寄存器：R8~~R15，增加了8个128位XMM寄存器。
win64 ABI对于调用约定就是这样规定的，优先用寄存器传递前4个参数，但是栈上还是分配参数空间（32 个字节，前4 个参数的 64 位值）。该空间允许将传入函数的寄存器轻松地复制到已知的堆栈位置。不要求被调用函数将输入寄存器参数溢出至堆栈，但需要时，堆栈空间预留确保它可以这样做。当然，如果要传递 4 个以上的整数参数，则必须预留相应的额外堆栈空间。

在x64汇编中，两方面都发生了变化。一是前四个参数分析通过四个寄存器传递：RCX、RDX、R8、R9，如果还有更多的参数，才通过椎栈传递。二是调用者负责椎栈空间的分配与回收。

需要注意的是：

函数前四个整型参数分析通过四个寄存器传递：RCX、RDX、R8、R9
函数前四个float、double型参数分析通过四个寄存器传递：xmm0、xmm1、xmm2、xmm3
还有更多的参数，才通过椎栈传递
返回值也通过椎栈传递（RSP），该空间需要与输入参数一样预先分配

1、x64上面默认的函数调用约定是fast call，也就是ABI是fast call。
2.、前四个参数传递顺序是RCX，RDX，R8，R9，其余的参数通过压栈传递。注意这里有一个细节：前四个参数也是占用栈空间的，或者说，栈需要为前四个参数保留32个字节。
3、小于64位的参数传递时高位并不填充零，大于64位需要按照地址传递。
4、返回值在RAX
5、RAX，RCX，RDX，R8，R9，R10，R11是“易挥发”的，其余寄存器需要保护。
6、win64 ABI要求除了叶子函数（不再调用任何其他函数的函数）外，保证进入/退出函数时堆栈指针16-byte对齐。

堆栈平衡时RSP的公式为：n*8+1,对该结果再进行一次16-byte平衡(16-byte对其,形如30h,40h,50h，绝不会出现28h)。

例如：当被掉函数的参数数量n<=4时进行堆栈平衡时RSP的一般修改值为：30h。这是为什么？4个默认参数分配+1个返回值不是应该在堆栈上分配28h么？
答案是：这里需要进行堆栈对齐，而x64下的堆栈对齐是16-byte的，所以是30h。

x64下的调用范例：

testFun_float_stdcall(1, 2,3.0f,4.0,5,6.0,7.0f);
movss       xmm0,dword ptr [__real@40e00000 (07FF7396F0C18h)]  
movss       dword ptr [rsp+30h],xmm0  
movsd       xmm0,mmword ptr [__real@4018000000000000 (07FF7396F0C10h)]  
movsd       mmword ptr [rsp+28h],xmm0  
mov         dword ptr [rsp+20h],5  
movsd       xmm3,mmword ptr [__real@4010000000000000 (07FF7396F0E80h)]  
movss       xmm2,dword ptr [__real@40400000 (07FF7396F0E78h)]  
mov         edx,2  
mov         ecx,1  
call        testFun_float_stdcall (07FF7396E173Ah)

本编辑器支持 Markdown Extra , 　扩展了很多好用的功能。具体请参考Github.

表格

Markdown　Extra　表格语法：

项目	价格
Computer	$1600
Phone	$12
Pipe	$1

可以使用冒号来定义对齐方式：

项目	价格	数量
Computer	1600 元	5
Phone	12 元	12
Pipe	1 元	234

###定义列表

Markdown　Extra　定义列表语法：
项目１
项目２
: 定义 A
: 定义 B

项目３

定义 C

定义 D

定义D内容

代码块

代码块语法遵循标准markdown代码，例如：

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''