预处理
前言:上篇我们已经了解编译
与链接
的大概过程了,其中编译分为:预处理
(预编译
),编译
,汇编
。今天我们将详谈
其中的预处理
阶段,废话不多说,现在就开始预处理之旅。
一.预定义符号
C语言设置了一些预定义符号
,可以直接使用,预定义符号也是在预处理
期间处理的。
__FILE__
:进行编译的源文件 。__LINE__
:文件当前的行号 。__DATE__
:文件被编译的日期 。__TIME__
:文件被编译的时间 。__STDC__
:如果编译器遵循ANSI C,其值为1,否则未定义 。
二.#define定义常量
#define name stuff
- name:
常量标识符
。 - stuff:
常量内容
。 预处理
阶段:将常量标识符
转换成常量内容
。
举个例子:
思考:在define定义标识符
的时候,要不要在最后加上;
? ()
建议不要
加上 ; ,否则容易导致问题。比如下面的场景:
三.#define定义宏
#define机制包括了个规定,允许把参数替换到文本
中,这种实现通常称为宏
(macro)或定义宏
(define macro)。
#define name( parament-list ) stuff
- #define:
预处理指令
,用于定义宏。 - name:
宏的名称
,你可以在代码中使用这个名称来调用宏。 - ( parameter-list ):
宏的参数列表
,你可以在宏的定义中使用这些参数。 - stuff:
宏展开后的代码或表达式
,当你在代码中使用宏名称 name 并传入参数时,预处理器会将所有出现的 name( parameter-list ) 替换为 stuff。 宏的参数没有类型
。
注意
:参数列表的左括号必须与 name 紧邻
,如果两者之间有任何空白存在,参数列表就会被解释为 stuff 的一部分。
例子如下:
如果将参数改变为5+1,又会发生什么呢?
避免这种错误的方法就是加上圆括号。
总结
:所以用于对数值表达式
进行求值的宏定义都应该用这种方式加上括号
,避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用,不要吝啬圆括号
。
四. 带有副作用的宏参数
当宏参数
在宏的定义
中出现超过一次
的时候,如果参数带有副作用
,那么你在使用这个宏的时候就可能出现危险
,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:
x+1; //不带副作用
x++; //带有副作用
- 不带副作用
- 带有副作用
五.宏替换的规则
在程序中扩展#define定义符号
和宏
时,需要涉及以下步骤。
- 在调用宏时,首先对参数进行检查,看看是否包含任何由
#define定义的符号
。如果是,它们首先被替换
。 - 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
- 最后,再次对结果文件进行扫描,看看它是否包含任何由
#define定义的符号
。如果是,就重复
上述处理过程。
注意:
宏参数
和#define定义
中可以出现其他#define定义的符号
。但是对于宏
,不能出现递归
。- 当
预处理器
搜索#define定义的符号
的时候,字符串常量
的内容并不被搜索。
六.宏与函数
宏
通常被应用执行简单
的运算。
比如在两个数中找出较大的⼀个时,写成下面的宏
,更有优势
⼀些。
#include<stdio.h>
//宏
#define MAX(x, y) ((x)>(y)?(x):(y))
//函数
int Max(int x, int y)
{
return x > y ? x : y;
}
int main()
{
int a = 10;
int b = 20;
int m = MAX(a, b);
printf("%d\n", m);
m = Max(a, b);
printf("%d\n", m);
return 0;
}
那为什么不用函数来完成这个任务?原因有两点:
- 用于
调用函数
和从函数返回的代码
可能比实际执行这个小型计算工作所需要的时间更多
。所以宏比函数在程序的规模和速度方面更胜⼀筹。 - 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏则可以适用于整形、长整型、浮点型等可以用于 > 来比较的类型。
宏的参数没有类型
。
我们调试
后,转到反汇编
(单机右键找到反汇编),观察它们的汇编指令
。
和函数相比宏的劣势:
- 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则
可能大幅度增加程序的长度
。 - 宏是
没法调试
的(调试时,程序已经运行,宏已经完成了替换工作,无法观察)。 - 宏由于
参数类型无关
,也就不够严谨
。 - 宏可能会带来
运算符优先级的问题
,导致程容易出现错。
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型
,但是函数做不到
。
#include<stdio.h>
#include<stdlib.h>
#define MALLOC(n, type) (type*)malloc(n*sizeof(type))
int main()
{
int* p = (int*)malloc(10 * sizeof(int));//right
int* q = (int*)malloc(10, int);//error
int* s = MALLOC(10, int);//right
//int* s = (int*)malloc(10 * sizeof(int));替换后的结果
return 0;
}
宏
和函数
的对比表格
属性 | #define定义宏 | 函数 |
---|---|---|
代码长度 | 每次使用时,宏代码都会被插入到程序中。除了非常小的宏之外,程序的长度会大幅度增长 | 函数代码只出现于一个地方;每次使用函数时,都调用那个地方的同一份代码 |
执行速度 | 更快 | 存在函数的调用和返回的额外开销,相对慢 一些 |
操作符优先级 | 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生不可预料的后果,所以建议宏在书写的时候多写括号 。 | 函数参数只在函数调用的时候求一次返回值的结果,值传递给函数。表达式的求值的结果容易预测 。 |
带有副作用的参数 | 参数可能被替换到宏体中的多个位置,如果宏的参数被多次计算,带有副作用的参数求值可能会产生不可预料的结果 。 | 函数参数只在传参的时候求值一次,结果容易控制 。 |
参数类型 | 宏的参数与类型无关 ,只要对参数的操作是合法的,它就可以使用于任何参数类型。 | 函数的参数是与类型有关 的,如果参数类型不同,就需要不同的函数,即使他的任务是不同的。 |
调试 | 宏是不方便调试 的 | 函数是可以逐语句调试 的 |
递归 | 宏是不能递归 的 | 函数是可以递归 的 |
总结:
- 实现的逻辑比较简单,可以考虑使用宏。
- 否则考虑函数。
七.#和##
在此之前我们先介绍printf函数
的一个盲区
#include<stdio.h>
int main()
{
printf("Hello world\n");//一般写法
printf("Hello"" world\n");//特别写法
return 0;
}
1.#运算符
- #运算符将
宏
的一个参数
转换为字符串字面量
。它仅允许出现在带参数的宏的替换列表中。 - #运算符所执行的操作可以理解为
“字符串化”
。
当我们有⼀个变量 int a = 10; 的时候,我们想打印出: the value of a is 10 就可以写:
这时#就派上用场了。
2.##运算符
##
: 可以把位于它两边的符号合成一个符号
,它允许宏定义从分离的文本片段创建标识符。 ## 被称为记号粘合
这样的连接必须产生合法的标识符
。否则其结果就是未定义的。
这里我们想想,写一个函数求2个数的较大值的时候,不同的数据类型就得写不同的函数。比如:
int int_max(int x, int y)
{
return x>y?x:y;
}
float float_max(float x, float y)
{
return x>yx:y;
}
不同的参数类型,要写不同的函数,太繁琐
了,现在我们这样写代码试试:
在实际开发过程中##使用的很少。
八.命名约定
一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。那我们平时的一个习惯是:
- 把
宏名
全部大写
。 - 函数名
不要
全部大写。
九.#undef
解释:这条指令用于移除一个宏定义。如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。
#undef NAME
十.命令行定义
许多C的编译器
提供了一种能力,允许在命令行中定义符号
。用于启动编译
过程。
例如:当我们根据同一个源文件要编译出一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大些,我们需要一个数组能够大些。)
十一.条件编译
条件编译
:在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令
。
1.单分支(#if,#endif)
//单分支的条件编译指令
#if 常量表达式
//...
#endif
//常量表达式由预处理器求值
注意:有#if
必须要有#endif
与其对应,否则#if后面的代码都不参与编译,相当与被注释掉了。而不像if,else语句后面不加{}只跟一条语句,可以不加else。
注意:#if
后面必须是常量表达式
。
2.多分支(#if,#elif,#else,#endif)
//多分支的条件编译指令
#if 常量表达式
//...
#elif 常量表达式
//...
#else
//...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#include<stdio.h>
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif
一般用于跨平台
代码的编写。
十二.头文件的包含
1.头文件被包含的方式
1.本地文件包含
#include "filename"
查找策略
:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。
Linux环境的标准头文件的路径:
/usr/include
VS环境的标准头文件的路径:
C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include
//这是VS2013的默认路径
注意:按照自己的安装路径去找,如果找不到就提示编译错误。
2.库文件包含
#include <filename.h>
查找头文件
:直接去标准路径下去查找,如果找不到就提示编译错误。
这样是不是可以说,对于库文件也可以使用 “” 的形式包含?答案:肯定的。但是这样做查找的效率低
些,当然这样也不容易区分是库文件还是本地文件了。
2.嵌套文件包含
我们已经知道, #include指令
可以使另外一个文件被编译。就像它实际出现于 #include 指令的
地方一样。这种替换的方式很简单:预处理器先删除
这条指令,并用包含文件的内容替换
。
例如:一个头文件被包含10次,那就实际被编译10次,如果重复包含,对编译的压力就比较大
。
你也许会想,我无论如何都不会这样傻傻地写代码,但是有时候却由不得你,如下:
如果com.h文件比较大,这样预处理后代码量会剧增
。如果工程比较大
,有公共使用的头文件,被大家都能使用,又不做任何的处理,那么后果不堪设想
。
那么如何解决头文件被重复引入的问题?答案:条件编译
。
1.解决方案1
每个头文件的开头写:
#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容......
#endif //__TEST_H__
2.解决方案2
更简单的方法:每个头文件的开头写如下:
#pragma once
注:推荐《高质量C/C++编程指南》中附录的考试试卷(很重要)。
笔试题:
头文件
中的#ifndef
/#define
/#endif
是干什么用的?
答:这种结构在预处理阶段可以有效地避免由于头文件的重复包含而导致的编译错误。通过正确使用 #ifndef、#define 和 #endif,可以确保头文件只被包含一次,提高代码的可移植性和可维护性。
#include<filename.h>
和#include"filename.h"
有什么区别?
答:在查找策略。
#include<filename.h>:只在标准库中查找头文件,找不到就提示编译错误;
#include"filename.h":编译器会首先在当前源文件所在目录下查找该头文件,如果找不到再到系统头文件路径下查找。
十三.其他预处理指令
#error
#line
#pramge
#pramge pack()//设置结构体默认对齐数
参考《C语言深度解剖》学习
创作不易,如果能帮到你的话能赏个三连吗?感谢啦!!!