Windows模块加载基址与地址计算

最新推荐文章于 2022-03-10 21:32:35 发布

lujun-cc

最新推荐文章于 2022-03-10 21:32:35 发布

阅读量3.4k

点赞数 1

分类专栏：编程技术

本文链接：https://blog.csdn.net/henan_lujun/article/details/8965030

版权

编程技术专栏收录该内容

30 篇文章 0 订阅

订阅专栏

每个可执行模块和DLL模块都有一个首选的基地址，用于标识模块应该映射到的进程地址空间中的理想内存地址。当创建一个可执行模块时，链接程序将该模块的首选基地址设置为0x0040 0000；如果是DLL模块，链接程序设置的首选基地址是0x1000 0000。使用Visual Studio的Dumpbin实用程序，可以看到一个映像的首选基地址，如前一部分所示。当加载某个可执行程序时，操作系统为新进程创建一个虚拟地址。然后该加载程序将可执行模块映射到内存地址0x0040 0000，并将DLL模块映射到0x10000000。

那么这个首选基址有什么用呢？让我们看一看下面的代码：

int g_x;

void Func()

{

g_x = 5; // This is the important line.

}

当编译器处理Func函数时，该编译器和链接程序创建类似下面的机器代码：

MOV [0x00414540], 5

换句话说，编译器和链接程序创建的机器代码实际上是在变量g_x的地址0x0041 4540中硬编码的代码。该地址位于机器代码中，用于标识变量在进程的地址空间中的绝对位置。但是，只有在可执行模块加载到它的首选基地址0x0040 0000中时，这个内存地址才是正确的。

如果在一个DLL模块中拥有与上面完全相同的代码，那将会如何呢？在这种情况下，编译器和链接程序将生成类似下面的机器代码：

MOV [0x10014540], 5

同样，注意DLL的变量g_z的虚拟内存地址是在磁盘驱动器上的DLL文件映像中硬编码的代码。而且，如果该DLL确实是在它的首选基地址上加载的，那么这个内存地址是绝对正确的。

现在假设我们的应用程序需要两个DLL。按照默认设置，链接程序将.exe模块的首选基地址设置为0x0040 0000，同时，链接程序将两个DLL模块的首选基地址均设置为0x1000 0000。如果想要运行.exe模块，那么加载程序便创建该虚拟地址空间，并将.exe模块映射到内存地址0x0040 0000中。然后加载程序将第一个DLL映射到内存地址0x1000 0000中。但是，当加载程序试图将第二个DLL映射到进程的地址空间中去时，它将无法把它映射到该模块的首选基地址中，必须改变该DLL模块的位置，将它放到别的什么地方。

假设加载程序将第二个DLL的地址改到0x2000 0000。这时，将变量g _ x的值改为5的代码应该是：

MOV [0x20014540], 5

但是文件映像中的代码却类似下面的样子：

MOV [0x10014540], 5

如果执行文件映像的代码，那么第一个DLL模块中大约有4个字节的值将被值5改写。这是不能允许的。加载程序必须修改这个代码。当链接程序创建你的模块时，它将把一个移位节嵌入产生的文件中。这一节包含一个字节位移的列表。每个字节位移用于标识一个机器代码指令使用的内存地址。如果加载程序能够将一个模块映射到它的首选基地址中，那么系统将永远不会访问模块的移位节。这当然是我们所希望的—你永远不希望使用移位节。

另一方面，如果该模块不能映射到它的首选基地址中，加载程序便打开模块的移位节，并对所有项目重复执行该操作。对于找到的每个项目，加载程序将转至包含要修改机器代码指令的存储器页面。然后它抓取机器指令当前正在使用的内存地址，并将模块的首选基地址与模块实际映射到的地址之间的差与该地址相加。

因此，在上面的例子中，第二个DLL被映射到0x2000 0000，但是它的首选基地址是0x1000 0000。差是0x1000 0000，然后这个差与机器代码指令的地址相加，产生的结果如下：

MOV [0x20014540], 5

还以本文档中常用的DllTwo动态库在实际加载时的状况为例来说明问题。在该动态库中，有dlltwo.cpp，其中一个函数如下：

//Dlltwo.cpp

……

int CrashFun()

{

char * p = 0;

生成的map文件部分内容如下：

Dlltwo.map

……

Preferred load address is 10000000

Start Length Name Class

0001:00000000 00000da6H .text CODE

……

0001:00000cd0 ?CrashFun@@YAHXZ 10001cd0 f DllTwo.obj

该动态库的实际加载地址、CrashFunc函数的入口地址在下图中清晰可见：

下面的图显示了从代码到map文件再到进程地址空间中的一个映射关系：

从上面的映射过程，可以看出实际指令在进程空间中的实际地址和模块基址及各偏移量之间的转换关系：

实际地址＝模块实际加载地址＋代码段偏移基址＋段内偏移量

其中，模块的实际加载地址，一般情况下是动态产生的，需要使用调试器或者其他辅助工具才能看到。而后面两项在程序编译链接后就是固定的了，其中代码段的便宜基址在map文件中没有体现，但可以通过dumpbin工具查看，该值一般是0x1000；最后一个段内偏移量可在map文件中看到。

lujun-cc

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Windows模块加载基址与地址计算

<!--@font-face {font-family:宋体}@font-face {font-family:"@宋体"}p.MsoNormal, li.MsoNormal, div.MsoNormal {margin:0cm; margin-bottom:.0001pt; text-align:justify; text-justify:inter-ideog
复制链接

扫一扫