深入认识Turbo C编译器

http://www.cyuyan.com.cn/viewnews-66/

 

    有谁真正的理解过一个编译器呢?许多人认为TC很简单很落后,但是即便是这样简单的工具,到底有几个人真正的深入理解了呢?一个简单的编译 器都不能理解,如何能成为高手,如何能深入的使用更加高级的工具呢?不要以为自己使用的是VC就很了不起,因为使用这样傻瓜化的工具只能让你看不到事物的 本质。接下来我们就来深入的认识Turbo C编译器。

    广义的编译器,包括了代码编译器(compiler),目标文件 链 接器(linker),库文件管理工具(如tc的tlib,gcc的ar),编译驱动工具(如VC的NMake,gcc的make),ANSI c/c++标准的头文件和库文件,扩展的头文件和库文件,集成开发环境(IDE),等等与编译相关的工具,所有这些工具的集合,就组成了广义上的编译器。

    狭 义的编译器,则仅指compiler。compiler只负责将源代码,即.c/.cxx/.cpp文件编译成为目标文件.o/.obj。编译过程的输入 是源文件,包括自己书写的.c和.h以及系统提供的.h文件,编译的输出是目标文件。需要强调的一点时,在compile阶段,只处理源文件,所以不需要 库文件和额外的目标文件的参与,因此,只要代码在语法上没有错误,compile就一定能产生目标文件。

    对于一个广义的编译器来说以下几个部分是必备的:1.compiler,2.linker,3.系统提供的头文件和库文件。前面已经介绍了compiler,接下来看linker。

    linker 的功能是将目标文件进行装配,将浮动的地址变为确定的地址,这个工作是通过修改目标文件的重定位项来实现的,其具体的过程可以参考"Linker & loader"这本书,这是一本详细介绍linker和loader的好书,在此做个推荐。总之,link这一阶段处理的输入是目标文件,其输出是可执行 文件,或动态库。

    任何一个编译器都会提供库文件和与之对应的头文件,C/C++编译器一般都提供ANSI C/C++的库和相应的头文件。

    从现在起我们就需要建立起一个概念,就是广义的编译过程,实际上是由编译和链接两个基本步骤组成的,如果能深刻的理解这两个步骤,就是一大进步了。

    在编译器里,有一些默认的规定,我们需要了解。在编译器中,bin目录用于存放compiler、linker等工具,include目录用于存放头文件,lib目录用存放库文件,大多数的编译器的目录就是按这个来组织的。

接下来看Turbo C为我们提供了些什么(请到我的网站下载我动手制作的改良版TC编译器)。
bin目录中:
    CPP.EXE    是一个C语言 预处理 工具,就是负责对源代码进行预编译处理,不要理解为c++编译器
    TCC.EXE    是一个C语言的编译器,可以将代码编译为目标文件,并且能自动调用tlink链接生成可执行文件
    TASM.exe   是一个汇编工具,可以将x86的汇编代码编译成为目标文件
    TLink.exe  是一个链接器,负责对目标文件、库文件等进行链接
    TLib.exe   是一个库文件管理工具,可以将多个目标文件打包到一个库文件里
    BGIOBJ.exe 可以将BGI文件转换为.obj文件
    make.exe   符合GNU标准的make工具,可用于代码编译的管理(只有在我制作的TC中提供)
    TURBOC.CFG tcc默认的编译参数配置文件
以上所有的工具的使用方法都可以直接键入相应的命令进行查看,如键入tcc即可看到tcc的使用方法,因此这里不再讲解。

BGI目录中:
    EGAVGA.BGI 是EGAVGA的bgi驱动

FONT目录中:存放了BGI所使用到的各种字体文件

INCLUDE目录中:是Turbo C的库函数 的所有的头文件,当要使用某个库函数时可以在这个目录下搜索,找到其所在文件和原型,这里不在详细叙述。

重点讲一下Lib目录:
    init.obj文件是C语言的启动代码,它负责建立C程序运行的堆栈、初始化内存、调用C入口函数等。这部分代码是使用汇编书写的,其源代码可以在TC(官方版)里找到,名称为Init.ASM。
    c0t.obj、 c0s.obj、c0m.obj、c0c.obj、c0l.obj和c0h.obj文件,都是c code的入口函数实现,入口函数将会读取环境变量,并调用c语言中的main函数,将命令行参数传入main函数中,之后的控制权就交给了main函 数,也就是我们常说的C的主函数main。由于Turbo C中有不同的内存模式,因此以上6个文件分别对应TC中6种不同的内存模式。
    cc.lib、ch.lib、cl.lib、cm.lib、cs.lib五个文件都是TC提供的ANSI C标准库的库文件,分别对用不同的内存模式:
    cc compact模式
    ch huge模式
    cl large模式
    cm medium模式
    cs small模式

由于不同模式参数的入栈方式、函数的调用方式等等都各不一样,所以代码也不一样,因此需要分别提供各个模式的库文件。

    再 讲一下Turbo C中的内存模式。内存模式的出现不是由编译器决定的,而是由处理器的寻址方式决定的,在8086处理器中为了在16位寄存器的基础上寻址20位的地址,引 入了段寄存器和分段寻址的方式。在编译器这一级,利用这种段式的寻址方式,可以实现多种不同的存储分配方法,因此就产生了所谓的不同的内存模式。
    1. tiny模式:   程序 和数据在一个64K字节的段内
    2. small模式:  独立的代码段(64KB)和独立的数据段(64KB)
    3. medium模式: 单个数据段(64KB)和多个代码段(1MB)
    4. compack模式:单个代码段(64KB)和多个数据段(1MB)
    5. large模式:  多个代码段(1MB)和多个数据段(1MB),数据指针 不能跨越段边界,否则将回绕
    6. huge模式:   多个代码段(1MB)和多个数据段(1MB),数据指针可以跨越段边界,不会回绕

    在 TC中内存模式与far、near、huge等关键字又有着密切的关系。在tiny、small模式下,所有的函数定义、全局变量定义和指针变量的定义, 如果没有显示的加上far、near、huge等关键字,都默认为使用了near关键字;在medium模式下,函数定义默认使用了far关键字,变量定 义默认使用了near关键字;在compact模式下函数定义模式使用了near关键字,变量定义默认使用了far关键字;large模式下函数定义和变 量定义模认使用了far关键字;huge模式下函数定义模认使用了far关键字,变量定义默认使用了huge关键字。

    near、 far、huge关键字的真正含义是什么?这三个关键字只能用于修改函数、全局变量和指针变量,对于非指针类型的局部变量,这些关键字没有实际意义。这些 关键字用于修饰函数时,huge的含义与far相同,用于指明该函数的调用方式为far调用方式,即调用时需要一个段值和一个段偏移组成的32bits调 用地址,使用far call进行跳转,跳转前先压栈保存当前CS:IP。near修饰函数时,用于指明该函数的调用方式为near调用方式,调用时只需要一个16bits的 近地址,即当前CS的段内偏移。

    当这三个关键字用于修饰指针时,near型指针实质上为16bits的无符号整型数,该整数给出了 所指向变量在当前数据段内的偏移地址,也就是说,在使用near型指针寻址时实际上是进行如下的寻址操作:[DS:指针变量值]。对于far型的指针变 量,可以寻址1MB地址空间的任意一个地方,far型指针的实质是一个32bits的整型数,高16bits为段值,低16bits为段内偏 移,Turbo C中在使用far型指针时,会先将高16bits放入ES寄存器中,然后再进行如下的寻址操作:[ES:指针变量低16bits值]。对于hug型的指针 变量,与far性指针变量的不同之处在于,在对far型指针变量进行+/++/-/--等操作时,far型指针变量保持段值不变(也就是高 16bits),而只对段内偏移进行加减操作,所以会出现段内回绕的现象,而huge型的指针,在进行加减操作时将会自动的改变段值,不会出现段内回绕。 所以给人的感觉就是huge指针能比far指针寻址更大的内存空间。

    对于局部变量,由于是创建在堆栈上,所以near、far等关 键字将不具备任何意义,因为创建在堆栈上的变量的寻址方式就只有一种,即使用sp和bp维护函数堆栈,利用bp+/-一个偏移来寻址函数参数变量和局部变 量。这样的寻址方式是固定而唯一的,near和far等关键字都派不上用场,这里的near和far将没有任何的实际含义。

    对于使用near、far和huge修饰的全局变量的含义也很容易理解了。near型的全局变量,被分配到了当前的数据段上,寻址这个变量只需要一个16bits的偏移量,而far型全局变量在寻址时,需要给出段值和偏移量。huge型数组 可以使用大于64K的内存空间。

    far、 near、huge型指针变量之间的相互转换,从小尺寸的指针到大尺寸的指针将进行自动的类型转换,转换方式为加上当前的DS形成32bits的指针。从 大尺寸的指针到小尺寸的指针需要进行强制类型转换,转换的结果为只保留低16bits,但是这样俄转换没有实际的意义或者说用处不大,并且极其容易引入内 存访问的错误,所以要严格避免使用。

    需要注意的是,near、far、huge三个关键字的使用,还需要内存模式的紧密配合。但并不是说tiny模式下就不能使用near、far、huge三个关键字。tiny模式下同样可以定义如下的指针:
    char far *pbuf = 0xA0000000;
    并且我能保证这个指针能够绝对正确的工作,对函数、全局变量的修饰也是如此。但是如何正确的工作,如何才是最和合理的方式,请自己思考了。基本的原理我也讲的很清楚,就不再多费唇舌。

    Turbo C中,我想最为困惑的就是内存模式了,我也是费了很多时间和精力,通过分析Turbo C的汇编代码的出的以上结论。许多朋友都对此很困惑,所以这部分重点讲了下,和大家分享。如有不正确之处,请不吝赐教,旨在抛砖引玉。tcc编译汇编代码 的方法为:tcc -c -mt -S filename.c,-c指明compile only,-mx用于指定内存模式,-S指明生成汇编代码,如果大家有兴趣可以尝试使用这个方法分析tcc编译结果的汇编代码,从而更加深刻的理解C与汇 编的关系。

    当我们在编写、制作并向用户提供自己的库文件时,也需要注意内存模式的匹配,否则在进行链接时会存在问题。一个较为简单 的方法就是向用户提供全套内存模式的库文件,这也是Turbo C的ANSI C库的做法,前文已经提到。如果不想提供多个内存模式的库文件,可以对程序中每个函数、全局变量和指针变量进行显式的类型声明,以精确定义每个变量的类 型。

    关于TC中各种编译工具的使用方法,可以直接参考其帮助,并且许多参考文档都有说明,这里我就不再详细介绍了。关于GNU的 make工具的使用,同样也可以在网上找到参考资料,因此不再介绍。还有就是关于Turboc的BGI驱动的,我也研究过多时,我这里有详细的参考文档, 并且已经实现了一个BGI的框架,对于有兴趣自己开发BGI的朋友,我们可以交流。当然Turbo C最大的魅力,也是最让我着迷的也就是它简单而直接的图形编程,可以直接的访问硬件资源,因此能收获许多底层、硬件相关的知识。当然Turbo C的图形编程是一个很大的课题,我也在不断的学习和研究之中,如果有机会也会继续写作相关的文章。

    关于TC,还有许多值得介绍的,但是一时也想不起来了,本来打算写的更加细致一点,但是心中只有这么点墨水,现在墨水已经写干了,等以后有时间,有墨水以后再继续这个话题吧。OK,结束了。

 

 

 

 

 

 

 

 

 

 

[编辑本段]Turbo C2.0    介绍      Turbo C2.0不仅是一个快捷、高效的编译程序,同时还有一个易学、易用的集成开发环境。使用Turbo C2.0无需独立地编辑、编译和连接程序,就能建立并运行C语言程序。因为这些功能都组合在Turbo 2.0的集成开发环境内,并且可以通过一个简单的主屏幕使用这些功能。    基本配置要求   Turbo C 2.0可运行于IBM-PC系列微机,包括XT,AT及IBM 兼容机。此时要求DOS2.0或更高版本支持,并至少需要448K的RAM,可在任何彩、单色80列监视器上运行。支持数学协处理器芯片,也可进行浮点仿真,这将加快程序的执行。 [编辑本段]Turbo C 2.0的主要文件的简单介绍   INSTALL.EXE 安装程序文件   TC.EXE 集成编译   TCINST.EXE 集成开发环境的配置设置程序   TCHELP.TCH 帮助文件   THELP.COM 读取TCHELP.TCH的驻留程序README 关于Turbo C的信息文件   TCCONFIG.EXE 配置文件转换程序MAKE.EXE   项目管理工具TCC.EXE   命令行编译TLINK.EXE   Turbo C系列连接器TLIB.EXE   Turbo C系列库管理工具C0?.OBJ 不   同模式启动代码C?.LIB   不同模式运行库GRAPHICS.LIB   图形库EMU.LIB   8087仿真库FP87.LIB 8087库   *.H Turbo C头文件   *.BGI 不同显示器图形驱动程序   *.C Turbo C例行程序(源文件)   其中:上面的?分别为:T Tiny(微型模式)S Small(小模式)C Compact(紧凑模式)M Medium(中型模式)L Large(大模式)H Huge(巨大模式)    Turbo C++ 3.0   “Turbo C++ 3.0”软件是Borland公司在1992年推出的强大的——C语言程序设计与C++面向对象程序设计 的集成开发工具。它只需要修改一个设置选项,就能够在同一个IDE集成开发环境下设计和编译以标准 C 和 C++ 语法设计的程序文件。 [编辑本段]C 语言   C语言起始于1968年发表的CPL语言,它的许多重要思想都来自于Martin Richards在1969年研制的BCPL语言,以及以BCPL语言为基础的与Ken Thompson在1970年研制的B语言。Ken Thompson用B语言写了第一个UNIX操作系统。M.M.Ritchie1972年在B语言的基础上研制了C语言,并用C语言写成了第一个在PDP-11计算机上研制的UNIX操作系统。1977年出现了独立于极其的C语言编译文本《看移植C语言编译程序》,从而大大简化了把C语言编译程序移植到新环境中所做的工作,这本身也就使UNIX的日益广泛使用,C语言也迅速得到推广。   1983年美国国家标准化协会(ANSI)根据C语言问世以来的各种版本,对C语言的发展和扩充制定了新的标准,成为ANSI C。1987年ANSI又公布了新标准————87ANSI C。   目前在微型计算机上使用的有Microsoft C、Quick C、Turbo C等多种版本。这些不同的C语言版本,基本部分是相同的,但是在有关规定上有略有差异。   C 语言发展如此迅速, 而且成为最受欢迎的语言之一, 主要因为它具有强大的功能。许多著名的系统软件, 如DBASE Ⅲ PLUS、DBASE Ⅳ 都是由C 语言编写的。用C 语言加上一些汇编语言子程序, 就更能显示C 语言的优势了,象PC- DOS ,WORDSTAR等就是用这种方法编写的。归纳起来C 语言具有下列特点:   1. C是中级语言   它把高级语言的基本结构和语句与低级语言的实用性结合起来。C 语言可以象汇编语言一样对位、字节和地址进行操作, 而这三者是计算机最基本的工作单元。   2. C是结构式语言   结构式语言的显著特点是代码及数据的分隔化, 即程序的各个部分除了必要的信息交流外彼此独立。这种结构化方式可使程序层次清晰, 便于使用、维护以及调试。C 语言是以函数形式提供给用户的, 这些函数可方便的调用, 并具有多种循环、条件语句控制程序流向, 从而使程序完全结构化。   3. C语言功能齐全   C 语言具有各种各样的数据类型, 并引入了指针概念, 可使程序效率更高。另外C 语言也具有强大的图形功能, 支持多种显示器和驱动器。而且计算功能、逻辑判断功能也比较强大, 可以实现决策目的。   4. C语言适用范围大   C 语言还有一个突出的优点就是适合于多种操作系统, 如DOS、UNIX,也适用于多种机型。   C语言的优点很多,但是也存在一些缺点,如运算优先级太多,运算能力方面不像其它高级语言那样强,语法定义不严格等。但是这些都不能阻止C语言成为一门广受欢迎的计算机编程语言!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值