ANSI标准定义的C语言预处理程序包括下列命令:
#define
#error
#include
#if
#else
#elif
#endif
#ifdef
#ifndef
#undef
#line
#pragma
非常明显,所有预处理命令均以符号#开头,下面分别加以介绍。
2. #define
命令#define定义了一个标识符及一个串。在源程序中每次遇到该标识符时,均以定义的串代换它。ANSI标准将标识符定义为宏名,将替换过程称为宏替换。命令的一般形式为:
#define identifier string
注意,该语句没有分号。在标识符和串之间可以有任意个空格,串一旦开始,仅由一新行结束。
例如,如希望TURE取值1,FALSE取值0,可说明两个宏#define
#define TURE 1
#define FALSE 0
这使得在源程序中每次遇到TURE或FALSE就用0或1代替。
例如,在屏幕上打印“012”:
printf("%d%d%d",FALSE,TRUE,TRUE+1);
宏名定义后,即可成为其它宏名定义中的一部分。例如,下面代码定义了ONE、TWO及THREE的值。
#define ONE 1
#define TWO ONE+ONE
#define THREE ONE+TWO
懂得宏替换仅仅是以串代替标识符这点很重要。因此,如果希望定义一个标准错误信息,可编写如下代码:
#define E_MS "standard error on input\n"
printf(E_MS);
编译程序遇到标识符E_MS时,就用“standarderror on input\n”替换。对于编译程序,printf()语句实际是如下形式:
printf("standard error on input\n;")
如果在串中含有标识符,则不进行替换。例如:
#define XYZ this is a test
printf("XYZ");
该段不打印"this is a test"而打印"XYZ"。
如果串长于一行,可以在该行末尾用一反斜杠续行,例如:
#define LONG_STRING "this is a very long\
string that is used as an example"
C语言程序普遍使用大写字母定义标识符。这种约定可使人读程序时很快发现哪里有宏替换。最好是将所有的#define放到文件的开始处或独立的文件中(用#include访问),而不是将它们分散到整个程序中。
宏代换的最一般用途是定义常量的名字和程序中的“游戏数”。例如,某一程序定义了一个数组,而它的几个子程序要访问该数组,不应直接以常量定数组大小,最好是用名字定义之(需改变数组大小时)。
#define MAX_SIZE 100
float balance[MAX_SIZE];
#define命令的另一个有用特性是,宏名可以取参量。每次遇到宏名时,与之相连的形参均由程序中的实参代替。例如:
当编译该程序时,由MIN(a,b)定义的表达式被替换,x和y用作操作数,即printf()语句被代换后取如下形式:
printf("the minimum is:%,d"(x<y)?x:y);
用宏代换代替实在的函数的一大好处是宏替换增加了代码的速度,因为不存在函数调用的开销。但增加速度也有代价:由于重复编码而增加了程序长度。
3. #error
处理器命令#error强迫编译程序停止编译,主要用于程序调试。
4. #include
命令#include使编译程序将另一源文件嵌入带有#include的源文件,被读入的源文件必须用双引号或尖括号括起来。例如:
#include"stdio.h"
#include<stdio.h>
这两行代码均使用C编译程序读入并编译用于处理磁盘文件库的子程序。
将文件嵌入#include命令中的文件内是可行的,这种方式称为嵌套的嵌入文件,嵌套层次依赖于具体实现。
如果显式路径名为文件标识符的一部分,则仅在哪些子目录中搜索被嵌入文件。否则,如果文件名用双引号括起来,则首先检索当前工作目录。如果未发现文件,则在命令行中说明的所有目录中搜索。如果仍未发现文件,则搜索实现时定义的标准目录。
如果没有显式路径名且文件名被尖括号括起来,则首先在编译命令行中的目录内检索。
如果文件没找到,则检索标准目录,不检索当前工作目录。
5条件编译命令
有几个命令可对程序源代码的各部分有选择地进行编译,该过程称为条件编译。商业软件公司广泛应用条件编译来提供和维护某一程序的许多顾客版本。
1.#if、#else,#elif及 #endif
#if的一般含义是如果#if后面的常量表达式为true,则编译它与#endif之间的代码,否则跳过这些代码。命令#endif标识一个#if块的结束,参见例4-13。
#if constant-expression
statement sequence
#endif
由于MAX大于99,以上程序在屏幕上显示一串消息。该例说明了一个重点:跟在#if后面的表达式在编译时求值,因此它必须仅含常量及已定义过的标识符,不可使用变量。表达式不许含有操作符sizeof。
#else命令的功能有点象C语言中的else;#else建立另一选择(在#if失败的情况下)。因而上面的例子可扩充,参见例4-14。
在此例中,因为M A X小于9 9,所以,不编译#if块,而是编译# else块,因此,屏幕上显
示"compiled for small array"这一消息。
注意,#else 既是 #if 块又是 #else 块头。这是因为任何#if 仅有一个#endif。
#elif命令意义与ELSE IF 相同,它形成一个if else-if阶梯状语句,可进行多种编译选择。
#elif 后跟一个常量表达式。如果表达式为t ru e,则编译其后的代码块,不对其它#elif表达式进行 测试 。否则,顺序 测试 下一块。
#if expression
statement sequence
#elif expression1
statement sequence
#elif expression2
statement sequence
#elif expression3
statement sequence
#elif expression4
#elif expression3N
statement sequence
#endif
例如:下面程序利用ACTI Ve_ COUNTRY定义货币符号。
#define US 0
#define ENGLAND1
#define FRANCE 2
#define ACTIVE_COUNTRY US
#if ACTIVE_COUNTRY = = US
char currency[ ]="dollar";
#elif ACTIVE_COUNTRY= =ENGLAND
char currency[ ]="pound";
#else
char currency[ ]="france";
#endif
#if与#elif命令可能一直嵌套到实现规定的权限,其中#endif、#else或#elif与最近#if或#elif关联。例如,下面程序是完全有效的。
#if MAX>100
#if SERIAL_VERSION
int port=198;
#elif
int port=200;
#elif
#else
char out_buffer[100];
#endif
2. # ifdef 和# ifndef
条件编译的另一种方法是用#ifdef与#ifndef命令,它们分别表示“如果有定义”及“如果无定义”。
#ifdef的一般形式是:
#ifdef macroname
statement sequence
#endif
如果宏名在前面# def i n e语句中已定义过,则该语句后的代码块被编译。
#ifndef的一般形式是:
#ifndef macroname
statement sequence
#endif
如果宏名在#define 语句中无定义,则编译该代码块。
#ifdef 与#ifndef可以用于#else 语句中,但#elif 不行。参见4 - 1 5。
上述代码打印“ Hi Ted ”及“ RALPHnot defined”。如果T E D没有定义,则显示“ Hi a n y o n e”,后面是“ RALPH not defined”。
可以像嵌套#if 那样将#ifdef 与#ifndef 嵌套至任意深度。
6 #undef
命令#undef 取消其后那个前面已定义过有宏名定义。一般形式为:
#undef macroname
例如:
#define LEN 100
#difine WIDTH 100
char array[LEN][WIDTH];
#undef LEN
#undef WIDTH
/ *at this point both LEN and WIDTH are undefined* /
直到遇到#undef 语句之前, L E N与W I D T H均有定义。
# undef 的主要目的是将宏名局限在仅需要它们的代码段中。
7 #line
命令# line改变_LINE_ 与_ F I L E _的内容,它们是在编译程序中预先定义的标识符。
命令的基本形式如下:
#line number["filename"]
其中的数字为任何正整数,可选的文件名为任意有效文件标识符。行号为源程序中当前行号,文件名为源文件的名字。命令#line主要用于调试及其它特殊应用。
例如,下面说明行计数从1 0 0开始;printf() 语句显示数1 0 2,因为它是语句#line 100后的第3行。
#line 100 /* 初始化行计数器* /
main( ) /* 行号100 */
{ /* 行号101 */
printf ( "%d\n",_line_) ; /* 行号102 */
}
8. #pragma
命令#pragma 为实现时定义的命令,它允许向编译程序传送各种指令。例如,编译程序可能有一种选择,它支持对程序执行的跟踪。可用#pragma语句指定一个跟踪选择。
在所有的预处理指令中,#pragma 指令可能是最复杂的了,它的作用是设定编译器的状态或者是指示编译器完成一些特定的动作。
#pragma指令对每个编译器给出了一个方法,在保持与C和 C++ 语言完全兼容的情况下,给出主机或操作系统专有的特征。
依据定义,编译指示是机器或操作系统专有的,且对于每个编译器都是不同的。
其格式一般为: #pragma para
其中para为参数,下面来看一些常用的参数。
(1)message 参数
message参数是我最喜欢的一个参数,它能够在编译信息输出窗口中输出相应的信息,
这对于源代码信息的控制是非常重要的。其使用方法为:
#pragma message("消息文本")
当编译器遇到这条指令时就在编译输出窗口中将消息文本打印出来。
当我们在程序中定义了许多宏来控制源代码版本的时候,我们自己有可能都会忘记有没有正确的设置这些宏,
此时我们可以用这条指令在编译的时候就进行检查。假设我们希望判断自己有没有在源代码的什么地方定义了_X86这个宏,
可以用下面的方法:
#ifdef _X86
#pragma message("_X86 macro activated!")
#endif
我们定义了_X86这个宏以后,应用程序在编译时就会在编译输出窗口里显示"_86macro activated!"。
我们就不会因为不记得自己定义的一些特定的宏而抓耳挠腮了。
(2)另一个使用得比较多的pragma参数是code_seg
格式如:
#pragma code_seg( ["section-name" [,"section-class"] ] )
它能够设置程序中函数代码存放的代码段,当我们开发驱动程序的时候就会使用到它。
(3)#pragma once (比较常用)
只要在头文件的最开始加入这条指令就能够保证头文件被编译一次,这条指令实际上在VC6中就已经有了,
但是考虑到兼容性并没有太多的使用它。
(4)#pragma hdrstop
表示预编译头文件到此为止,后面的头文件不进行预编译。BCB可以预编译头文件以加快链接的速度,
但如果所有头文件都进行预编译又可能占太多磁盘空间,所以使用这个选项排除一些头文件。
有时单元之间有依赖关系,比如单元A依赖单元B,所以单元B要先于单元A编译。
你可以用#pragma startup指定编译优先级,如果使用了#pragma package(smart_init),
BCB就会根据优先级的大小先后编译。
(5)#pragma resource "*.dfm"
表示把*.dfm文件中的资源加入工程。*.dfm中包括窗体
外观的定义。
(6)#pragma warning( disable: 4507 34; once:4385; error: 164 )
等价于:
#pragma warning( disable: 4507 34) // 不显示4507和34号警告信息
#pragma warning( once: 4385) // 4385号警告信息仅报告一次
#pragma warning( error: 164) // 把164号警告信息作为一个错误。
同时这个pragma warning 也支持如下格式:
#pragma warning( push [, n ] )
#pragma warning( pop )
这里n代表一个警告等级(1---4)。
#pragma warning( push )保存所有警告信息的现有的警告状态。
#pragma warning( push, n )保存所有警告信息的现有的警告状态,并且把全局警告等级设定为n。
#pragma warning( pop )向栈中弹出最后一个警告信息,在入栈和出栈之间所作的一切改动取消。例如:
#pragma warning( push )
#pragma warning( disable: 4705 )
#pragma warning( disable: 4706 )
#pragma warning( disable: 4707 )
//.......
#pragma warning( pop )
在这段代码的最后,重新保存所有的警告信息(包括4705,4706和4707)。
(7)#pragma comment(...)
该指令将一个注释记录放入一个对象文件或可执行文件中。
常用的lib关键字,可以帮我们连入一个库文件。如:
#pragma comment(lib,"comctl32.lib")
#pragma comment(lib, "vfw32.lib")
#pragma comment(lib, "wsock32.lib")
每个编译程序可以用#pragma指令激活或终止该编译程序支持的一些编译功能。
例如,对循环优化功能:
#pragma loop_opt(on) // 激活
#pragma loop_opt(off) // 终止
有时,程序中会有些函数会使编译器发出你熟知而想忽略的警告,
如“Parameter xxx is never used in function xxx”,可以这样:
#pragma warn —100 // Turn off the warning message for warning #100
int insert_record(REC *r)
{ /* function body */ }
#pragma warn +100 // Turn the warning message for warning #100 back on
函数会产生一条有唯一特征码100的警告信息,如此可暂时终止该警告。
每个编译器对#pragma的实现不同,在一个编译器中有效在别的编译器中几乎无效。可从编译器的文档中查看。
补充 —— #pragma pack 与 内存对齐问题
许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k
(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignmentmodulus)。
Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:
任何基本数据类型T的对齐模数就是T的大小,即sizeof(T)。比如对于double类型(8字节),
就要求该类型数据的地址总是8的倍数,而char类型数据(1字节)则可以从任何一个地址开始。
Linux下的GCC奉行的是另外一套规则(在资料中查得,并未验证,如错误请指正):
任何2字节大小(包括单字节吗?)的数据类型(比如short)的对齐模数是2,而其它所有超过2字节的数据类型
(比如long,double)都以4为对齐模数。
ANSI C规定一种结构类型的大小是它所有字段的大小以及字段之间或字段尾部的填充区大小之和。
填充区就是为了使结构体字段满足内存对齐要求而额外分配给结构体的空间。那么结构体本身有什么对齐要求吗?
有的,ANSI C标准规定结构体类型的对齐要求不能比它所有字段中要求最严格的那个宽松,可以更严格。
如何使用c/c++中的对齐选项
vc6中的编译选项有 /Zp[1|2|4|8|16],/Zp1表示以1字节边界对齐,相应的,/Zpn表示以n字节边界对齐。
n字节边界对齐的意思是说,一个成员的地址必须安排在成员的尺寸的整数倍地址上或者是n的整数倍地址上,取它们中的最小值。
也就是:
min ( sizeof ( member ), n)
实际上,1字节边界对齐也就表示了结构成员之间没有空洞。
/Zpn选项是应用于整个工程的,影响所有的参与编译的结构。
要使用这个选项,可以在vc6中打开工程属性页,c/c++页,选择Code Generation分类,在Struct memberalignment可以选择。
要专门针对某些结构定义使用对齐选项,可以使用#pragma pack编译指令:
(1) #pragma pack( [ n ] )
该指令指定结构和联合成员的紧凑对齐。而一个完整的转换单元的结构和联合的紧凑对齐由/Zp 选项设置。
紧凑对齐用pack编译指示在数据说明层设置。该编译指示在其出现后的第一个结构或联合说明处生效。
该编译指示对定义无效。
当你使用#pragma pack ( n ) 时,这里n 为1、2、4、8 或16。
第一个结构成员之后的每个结构成员都被 存储 在更小的成员类型或n 字节界限内。
如果你使用无参量的#pragma pack, 结构成员被紧凑为以/Zp指定的值。该缺省/Zp 紧凑值为/Zp8 。
(2) 编译器也支持以下增强型语法:
#pragma pack( [ [ { push | pop } , ] [identifier, ] ] [ n] )
若不同的组件使用pack编译指示指定不同的紧凑对齐,这个语法允许你把程序组件组合为一个单独的转换单元。
带push参量的pack编译指示的每次出现将当前的紧凑对齐 存储 到一个内部编译器堆栈中。
编译指示的参量表从左到右读取。如果你使用push, 则当前紧凑值被存储起来;
如果你给出一个n 的值, 该值将成为新的紧凑值。若你指定一个标识符, 即你选定一个名称,
则该标识符将和这个新的的紧凑值联系起来。
带一个pop参量的pack编译指示的每次出现都会检索内部编译器堆栈顶的值,并且使该值为新的紧凑对齐值。
如果你使用pop参量且内部编译器堆栈是空的,则紧凑值为命令行给定的值, 并且将产生一个警告信息。
若你使用pop且指定一个n的值, 该值将成为新的紧凑值。若你使用p o p 且指定一个标识符,
所有存储在堆栈中的值将从栈中删除, 直到找到一个匹配的标识符,这个与标识符相关的紧凑值也从栈中移出,
并且这个仅在标识符入栈之前存在的紧凑值成为新的紧凑值。如果未找到匹配的标识符,
将使用命令行设置的紧凑值, 并且将产生一个一级警告。缺省紧凑对齐为8。
pack编译指示的新的增强功能让你编写头文件, 确保在遇到该头文件的前后的
紧凑值是一样的。
(3) 栈内存对齐
在vc6中栈的对齐方式不受结构成员对齐选项的影响。它总是保持对齐,而且对齐在4字节边界上。
9 预定义的宏名
A N S I标准说明了五个预定义的宏名。它们是:
_line_
_FILE_
_DATE_
_TIME_
_STDC_
如果编译不是标准的,则可能仅支持以上宏名中的几个,或根本不支持。记住编译程序也许还提供其它预定义的宏名。
_line_ 及 _FILE_ 宏指令在有关# line的部分中已讨论,这里讨论其余的宏名。
_DATE_ 宏指令含有形式为月/日/年的串,表示源文件被翻译到代码时的日期。
源代码翻译到目标代码的时间作为串包含在_TIME_中。串形式为时:分:秒。
如果实现是标准的,则宏 _STDC_ 含有十进制常量1。如果它含有任何其它数,则实现是非标准的。
注意:宏名的书写由标识符与两边各二条下划线构成。
10 注释
在C语言中,所有的注释由字符/ *开始,以* /结束。在星号及斜杠之间不允许有空格。编译程序忽略注释开始符到注释结束符间的任何文本。例如,下面程序在屏幕上只打印
“h e l l o”。
main ()
{
p r i n t f ( "hello" ) ;
/*printf ("This is a sample to print hell;o"*/)
}
注释可出现在程序的任何位置,但它不能出现在关键字或标识符中间。
即,注释x=10+ /*add the numbers */ 5;是有效的,但swi/*this will not work */tch(c){...
是不正确的,因为C的关键字不能含有注释。通常也不希望表达式中间出现注释,因为这会使
意义含混不清。
注释不可嵌套,即一个注释内不可含有另一个注释。例如,下面代码段在编译时出错:
/*this is an outer comment
x = y / a ;
/*this is an inner comment -and causes an error */
* /
当需要解释程序的行为时,注释应简明扼要。除了最简单和最直观的函数外,都应有注释,在函数开始处说明其功能,如何调用以及返回何处