一、导入表的结构
导入表的结构看起来复杂,其实只是套娃,不要被它吓到了。
导入表的定义如下:
typedef struct _IMAGE_IMPORT_DESCRIPTOR {
union {
DWORD Characteristics; // 0 for terminating null import descriptor
DWORD OriginalFirstThunk; // RVA to original unbound IAT (PIMAGE_THUNK_DATA)
};
DWORD TimeDateStamp; // 0 if not bound,
// -1 if bound, and real date\time stamp
// in IMAGE_DIRECTORY_ENTRY_BOUND_IMPORT (new BIND)
// O.W. date/time stamp of DLL bound to (Old BIND)
DWORD ForwarderChain; // -1 if no forwarders
DWORD Name;
DWORD FirstThunk; // RVA to IAT (if bound this IAT has actual addresses)
} IMAGE_IMPORT_DESCRIPTOR;
其中比较重要的是 OriginalFirstThunk, Name 和 FirstThunk。
OriginalFirstThunk 是指向INT表的RVA,FirstThunk 是指向IAT表的RVA,Name是DLL的文件名。
INT表和IAT表在文件中是完全一样的(前提是没有绑定导入)。
INT表的结构是这样的:
IMAGE_THUNK_DATA 是一个4字节的数据,如果最高位是1,那么低31位就是函数的导出序号;如果最高位是0,那么它的值是一个RVA,指向一个 IMAGE_IMPORT_BY_NAME 结构。
typedef struct _IMAGE_IMPORT_BY_NAME {
WORD Hint;
BYTE Name[1];
} IMAGE_IMPORT_BY_NAME, *PIMAGE_IMPORT_BY_NAME;
其中低地址的Hint是导出序号,然而这个值可能并不准确,有些编译器会把它设置成0,我们只需要关注 Name,这个是一个以0结尾的字符串,表示函数名。
如果没有提前绑定函数地址,IAT表和INT表在文件中存储的数据是完全一样的。
二、导入表和IAT表的作用
EXE和DLL要使用其他DLL的函数,需要说明用到了哪些函数,导入表就是存储这些外部函数的函数名或导出序号的结构。使用了多少个DLL,就有多少个导入表。
IAT表可以认为是导入表的“子表”,因为导入表里的 FirstThunk 属性就是IAT表的RVA。EXE如果调用了DLL的函数,CALL 指令后面跟的地址其实是指向IAT表里的某个位置,运行之前在文件中的时候,IAT表和INT表一样,里面存储的要么是函数名,要么是导出序号。加载的时候操作系统会把IAT表里的值修改成函数真正在DLL中的地址,具体步骤是:
操作系统首先将exe和所有dll加载到4GB虚拟内存中,然后遍历导入表,根据DLL名字调用LoadLibrary获取模块句柄HMODULE,然后调用GetProcAddress获取函数地址,然后将函数地址写入到IAT表里。
三、解析导入表
编程打印导入表里的数据,包括DLL文件名,INT表和IAT表的数据。
// 打印导入表
VOID PrintImportTable(LPVOID pFileBuffer