.COM文件结构及原理

.COM文件结构及原理

     com文件结构比较简单,它包含程序的一个绝对映像,即为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映像从文件直接复制到内存,从而加载com程序,而不做任何改变。

     为加载一个com程序,MS-DOS首先试图分配内存,因为com程序必须位于一个64KB的段中,所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)。如果MS-DOS不能为程序、一个PSP、一个起始堆栈分配足够的内存,则分配尝试失败。否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使com程序本身不能大于64KB。在试图运行另一个程序或分配另外的内存之前,大部分com程序释放任何不需要的内存。

     分配内存后,MS-DOS在该内存的前256B建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00H,否则置位0FFH。MS-DOS还置AH为00或0FFH,这依赖于第二个FCB是否含有一个有效驱动器标识符。建造PSP后,MS-DOS在PSP后立即开始(偏移100H)加载com文件,它置SS、DS和ES为PSP的段地址,接着创建一个堆栈。为创建这个堆栈,在已分配了至少64KB内存的情况下,MS-DOS置SP为0000H;否则它置寄存器比所分配的自己总数大2的值。最后,将0000H进栈(这是为了保证与在早期MS-DOS版本上设计的程序的兼容性)。

     MS-DOS通过把控制传递给偏移100H处的指令而启动程序。程序设计者必须保证COM文件的第一条指令是程序的入口点。

     注意:因为程序是在偏移100H处加载,因此所有代码和数据偏移也必须相对于100H。汇编语言程序设计者可通过设置程序的初值为100H而保证这一点(例如通过在源程序的开始使用语句org 100h)。

========================================

以上是网上流传的COM文件的说明。总体来说比较简单,就是分配64K内存,即程序只有一个段,然后头256B字节设置为PSP(Program Segment Prefix,MS-DOS描述加载的程序的一个数据结构,详细解释见wikipedia),然后把整个COM文件加载到256B(100h)后面。设置CPU的段寄存器均为该段的基址,并IP调到100h处开始执行程序。

但是,这里有一个问题,就是栈。
究竟是栈在COM的前面,即 | PSP | STACK | COM | ?
还是栈在COM的后面,即| PSP | COM | STACK | ?
还是栈就是PSP,只不过从PSP的末尾开始使用(栈使用是从高地址到低的),即 | PSP or STACK | COM | ?
还是PSP并不包含在段中,栈下来接着是COM,即 ( PSP ) | STACK | COM | ?

========================================

以下是论坛中,zara的回答:

这个问题,其实很简单,debug 加载个 com 文件,r 命令看看 ds 及 cs 和 ss:sp 就是了,会发现 cs = ds = ss = psp 而 sp=fffe 。所以,stack 是在 com 所在 64KB 段的最后,这也是上面资料第二段开头那句“所以com文件的大小不能超过65024(64KB减去用于PSP的256B和用于一个起始堆栈的至少256B)”的由来,虽然通常堆栈并不需要到 256B 这么大。

======================================

在一个64K的段内存内,是整个COM文件的镜像,先是256B的PSP,然后是代码和数据。因为cs=ds=ss 所以堆栈在最后。即 |PSP|COM|STACK| 的结构。貌似堆栈可以不止256B大小,反正没有限制,覆盖到代码的区域,知道程序正常退出或出错为止。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值