com/exe文件结构及原理

 

http://hqiangbo.blog.163.com/blog/static/42933253200831062318739/

 

大家都害怕病毒,但都想了解病毒。要了解病毒,以及病毒的机理,就必须先了解一些文件的结构和原理,下面把COM/EXE文件的结构介绍一下:

一 .COM文件结构及原理
     com文件结构比较简单,它包含程序的一个绝对映像,即为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映像从文件直接复制到内存,从而加载com程序,而不做任何改变。
     为加载一个com程序,MS-DOS首先试图分配内存,因为com程序必须位于一个64KB的段中,所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)。如果MS-DOS不能为程序、一个PSP、一个起始堆栈分配足够的内存,则分配尝试失败。否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使com程序本身不能大于64KB。在试图运行另一个程序或分配另外的内存之前,大部分com程序释放任何不需要的内存。
     分配内存后,MS-DOS在该内存的前256B建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00H,否则置位0FFH。MS-DOS还置AH为00或0FFH,这依赖于第二个FCB是否含有一个有效驱动器标识符。建造PSP后,MS-DOS在PSP后立即开始(偏移100H)加载com文件,它置SS、DS和ES为PSP的段地址,接着创建一个堆栈。为创建这个堆栈,在已分配了至少64KB内存的情况下,MS-DOS置SP为0000H;否则它置寄存器比所分配的自己总数大2的值。最后,将0000H进栈(这是为了保证与在早期MS-DOS版本上设计的程序的兼容性)。
     MS-DOS通过把控制传递给偏移100H处的指令而启动程序。程序设计者必须保证COM文件的第一条指令是程序的入口点。
     注意:因为程序是在偏移100H处加载,因此所有代码和数据偏移也必须相对于100H。汇编语言程序设计者可通过设置程序的初值为100H而保证这一点(例如通过在源程序的开始使用语句org 100h)。

二.exe文件结构及原理
     exe文件比较复杂,属于一种多段的结构,是DOS最成功和复杂的设计之一。要了解exe文件,首先需要了解exe文件的文件头结构。
     每个exe文件包含一个文件头和一个可重定位程序的映像。文件头包含MS-DOS用于加载程序的信息,例如程序的大小和寄存器的初始值。文件头还指向一个重定位表,该表包含指向程序映像中可重定位段地址的指针链表。exe文件的文件头结构如表所示:
偏移量 含义 
00h~01h MZ,exe文件标记 
02h~03h 文件长度除以512的余数 
04h~05h 文件长度除以512的商 
06h~07h 重定位项的个数 
08h~09h 文件头除以16的商 
0ah~0bh 程序运行所需最小段数 
0ch~0dh 程序运行所需最大段数 
0eh~0fh 堆栈段的段值(SS) 
10h~11h 堆栈段的段值(SP) 
12h~13h 文件校验和 
14h~15h 装入模块入口时的IP值 
16h~17h 装入模块代码相对段值(CS) 
18h~19h 重定位表,开始位置,以位移地址表示 
1ah~1bh 覆盖号(程序驻留为零) 
1ch 重定位表,起点由偏移18h~19h给出,项数由06h~07h标明 

 一、DOS EXE文件头数据结构

   struct   DOSEXEHEAD_t

{

  unsigned   char     Mark1;            // LINK签名0x4D

  unsigned   char     Mark2;            // LINK签名0x5A

  unsigned   short   VolumeInLastPage;  // 最后一扇区字节数

  unsigned   short   CountOfPage;       // 扇区数

  unsigned   short   CountOfReallocItem; //重定位表的项数

  unsigned   short   SizeOfHeadInPara; // 以节为单位的EXE头大小

  unsigned   short   min_para;          // 程序下方所需最小节数

  unsigned   short   max_para;          // 程序下方所需最大节数

  unsigned   short   Start_SS;          // 入口点SS,相对值

  unsigned   short   Start_SP;          // 入口点SP

  unsigned   short   Reserved;          // 保留,目前为0x0000

  unsigned   short   Start_IP;          // 入口点IP

  unsigned   short   Start_CS;          // 入口点CS,相对值

  unsigned   short   FirstReallocPtr;   // 首重定位表项距头首部的字节数

};     程序映像包含处理代码和程序的初始数据,紧接在文件头之后。它的大小以字节为单位,等于exe文件的大小减去文件头的大小,也等于exHeaderSize的域的值乘以16。MS-DOS通过把该映像直接从文件复制到内存加载exe程序,然后调整定位表中说明的可重定位段地址。
     定位表是一个重定位指针数组,每个指向程序映像中的可重定位段地址。文件头中的exRelocItems域说明了数组中指针的个数,exRelocTable域说明了分配表的起始文件偏移量。每个重定位指针由两个16位值组成:偏移量和段值。为加载exe程序,MS-DOS首先读文件头以确定exe标志并计算程序映像的大小,然后它试图申请内存。首先,它计算程序映像文件的大小加上PSP的大小,再加上EXEHEADER结构中的exMinAlloc域说明的内存大小这3者之和。如果总和超过最大可用内存块的大小,则MS-DOS停止加载程序并返回一个出错值。否则,它计算程序映像的大小加上PSP的大小再加上EXEHEADER结构中exMaxAlloc域说明的内存大小之和,如果第二个总和小于最大可用内存块的大小,则MS-DOS分配计算得到的内存量。否则,它分配最大可用内存块。
     分配完内存后,MS-DOS确定段地址,也称为起始段地址,MS-DOS从此处加载程序映像。如果exMinAlloc域和exMaxAlloc域中的值都为零,则MS-DOS把映像尽可能地加载到内存最高端。否则,它把映像加载到紧挨着PSP域之上。
     接下来,MS-DOS读取重定位表中的项目调整所有由重定位指针说明的段地址。对于重定位表的每个指针,MS-DOS寻找指针映像中相应的可重定位段地址,并把起始段地址加到它之上。一旦调整完毕,段地址便指向了内存中被加载程序的代码和数据段。MS-DOS在所分配内存的最低部分建造256B的PSP,把AL和AH设置为加载com程序时所设置的值。MS-DOS使用文件头中的值设置SP与SS,调整SS初始值,把起始地址加载到它之上。MS-DOS还把EX和DS设置为PSP的段地址。最后,MS-DOS从程序文件头读取CS和IP的初始值,把起始段地址加到CS之上,把控制转移到位于调整后的地址处的程序。

三.什么是psp

 

 

事实上,无论是"COM"还是"EXE"文件,DOS在调入它们时都要保留256字节来预置一些数据,我们把这256字节称为"程序段前缀"(PSP--Program Segment Prefix),对于一个"COM"文件,由于只有一个段,所以PSP、代码、数据和堆栈都在这个段中,PSP在头部,堆栈在尾部,中间是代码和数据,一个"COM"程序在调入内存执行时DOS会自动在堆栈中存入一个0,所以"COM"程序只需使用近程的RET指令就能返回DOS,并且无需自己初始化堆栈。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值