文章目录
1. 程序的翻译环境和执行环境
翻译环境:将源代码转换为可执行的机器代码;
执行环境:用于实际执行代码;
图解过程如下:
2. 详解编译和链接
2.1 总过程详细图解
2.2 预处理、编译、链接解释
-
预处理:处理#开头的语句,会产生一个没有头文件(都已经被展开了)、没宏定义(都已经替换了)、注释也会消失掉;
-
编译:将预处理完的文件逐一进行一系列词法分析、语法分析、语义分析及优化后,产生相应的汇编代码文件。编译是针对单个文件编译的,只校验本文件的语法是否有问题,不负责寻找实体。
-
链接:通过链接器将一个个目标文件(或许还会有库文件)链接在一起生成一个完整的可执行程序,链接过程中会发现被调用的函数未被定义。
3.预处理详解
3.1预处理符号
FILE //进行编译的源文件
LINE //文件当前的行号
DATE //文件被编译的日期
TIME //文件被编译的时间
STDC //如果编译器遵循ANSI C,其值为1,否则未定义
3.2 #define 的详解
3.2.1 #define
定义标识符
语法:
#define name stuff
小知识:反斜杠 " \ " 有
续行符
的作用
#define do_forever for(;;) //用更形象的符号来替换一种实现
#define CASE break;case //在写case语句的时候自动把 break写上。
// 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
date:%s\ttime:%s\n" ,\
__FILE__,__LINE__ , \
__DATE__,__TIME__ )
小疑问:
在define定义标识符的时候,要不要在最后加上
;
?
解答: 不要加
;
,因为define 是将其整个进行替换,会出现两个; ;
的语法错误情况;
3.2.2 #define
定义宏
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏;
宏的申明方式:
#define name( parament-list ) stuff
注意:
参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
小测试1:
这道题目输出的
C
的最后答案是11
#define A 2+2
#define B 3+3
#define C A*B
int main()
{
printf("%d\n", C);
return 0;
}
提示:
所以用于对数值表达式进行求值的宏定义都应该加上括号,避免在使用宏时由于参数中
的操作符或邻近操作符之间不可预料的相互作用。
3.2.3 #
和##
的运用
如何把参数插入到字符串中 ?
案例代码如下:
char* p = "hello ""bit\n";
printf("hello"" bit\n");
printf("%s", p);
这里的输出是 :
hello bit
,可知字符串是有自动连接的特点;
方案一:
#define PRINT(FORMAT, VALUE)\
printf("the value is "FORMAT"\n", VALUE);
PRINT("%d", 10);
这里只有当字符串作为宏参数的时候才可以把字符串放在字符串中
方案二:
使用 # ,把一个宏参数变成对应的字符串
例如:
int i = 10;
#define PRINT(FORMAT, VALUE)\
printf("the value of " #VALUE "is "FORMAT "\n", VALUE);
PRINT("%d", i+3);//产生了什么效果?
代码中的 #VALUE
会预处理器处理为:"VALUE"
最终输出的结果:
the value of i+3 is 13
##
的作用
##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。
#define ADD_TO_SUM(num, value) \
sum##num += value;
...
ADD_TO_SUM(5, 10);//作用是:给sum5增加10
注意:这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。
3.2.4 带副作用的宏参数
当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能
出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现 x ++
这类表达。
MAX宏可以证明具有副作用的参数所引起的问题案例如下:
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
x = 5;
y = 8;
z = MAX(x++, y++);
printf("x=%d y=%d z=%d\n", x, y, z);//输出的结果是什么?
向把 a 用 x ++ ,b 用 y ++ 进行替换,然后再处理结果
z = ( (x++) > (y++) ? (x++) : (y++));
最后的输出结果为:x=6 y=10 z=9
3.2.5 宏和函数对比
宏通常被应用于执行简单的运算。
例如:两个数中找出最大的一个
#define MAX(a, b) ((a)>(b)?(a):(b))
小思考:为什么不用函数呢?
- 原因一:所以宏比函数在程序的规模和速度方面更胜一筹;
- 原因二:函数的参数必须声明为特定的类型,宏是类型无关的。
宏的缺点:
-
- 宏是没法调试的;
- 宏可能会带来运算符优先级的问题,导致程容易出现错;
- 每次使用宏的时候,一份宏定义的代码将插入到程序中,可能大幅度增加程序
的长度; - 宏由于类型无关,也就不够严谨;
- 宏不能进行递归;
宏可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到
#define MALLOC(num, type)\
(type *)malloc(num * sizeof(type))
//使用
MALLOC(10, int);//类型作为参数
//预处理器替换之后:
(int *)malloc(10 * sizeof(int));
3.3 #undef
这条指令用于移除一个宏定义
#undef NAME
//如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除
3.4 条件编译
调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译
常见的条件编译指令:
1.
#if 常量表达式
//...
#endif
//常量表达式由预处理器求值。
如:
#define __DEBUG__ 1
#if __DEBUG__
//..
#endif
2.多个分支的条件编译
#if 常量表达式
//...
#elif 常量表达式
//...
#else
//...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif
3.5 文件包含
- 本地文件包含
#include "filename"
查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标
准位置查找头文件。
如果找不到就提示编译错误。
VS环境的标准头文件的路径:
C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include
//这是VS2013的默认路径
- 库文件包含
#include <filename.h>
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
**小总结:**由此得出对于库文件也可以使用·“”
的形式包含;
3.6 嵌套文件包含
comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复==注意:==源文件被包含10次,那就实际被编译10次。
重复编译的例子:
如何解决这个文件内容不被重复编译的问题呢 ?
解决方案:条件编译
每个头文件的开头写:
#ifndef __TEST_H__ // TEST_H 是我们根据头文件的名字来定义的,可以改变
#define __TEST_H__
//头文件的内容
#endif //__TEST_H__
还有一种方案:
#pragma once
就可以避免头文件的重复引入。
4.易错题目
- 习题一: 下面文件中定义的四个变量,哪个变量不是指针类型 ?
#define INT_PTR int*
typedef int*int_ptr;
INT_PTR a,b;
int_ptr c,d;
解答: b 不是
预处理的#define是查找替换,所以替换过后的语句是“int*a,b;”,其中b只是一个int变量,如果要让b也是指针,必须写成“int *a, *b;”。而typedef没有这个问题,c、d都是指针。
- 习题二写一个宏,计算结构体中某变量相对于首地址的偏移,并给出说明
#define offsetof(StructType, MemberName) (size_t)&(((StructType *)0)->MemberName)
-
StructType是结构体类型名,MemberName是成员名。具体操作方法是:
-
- 先将0转换为一个结构体类型的指针,相当于某个结构体的首地址是0。此时,每一个成员的偏移量就成了相对0的偏移量,这样就不需要减去首地址了。
- 对该指针用->访问其成员,并取出地址,由于结构体起始地址为0,此时成员偏移量直接相当于对0的偏移量,所以得到的值直接就是对首地址的偏移量。
- 取出该成员的地址,强转成size_t并打印,就求出了这个偏移量。
-
习题三: 写一个宏,可以将一个整数的二进制位的奇数位和偶数位交换。
#define SwapIntBit(n) (((n) & 0x55555555) << 1 | ((n) & 0xaaaaaaaa) >> 1)
==解答:==交换奇偶位,需要先分别拿出奇偶位。既然是宏,分别拿出用循环不是很现实,那就用&这些位的方式来做。
奇数位拿出,那就是要&上010101010101……,
偶数位拿出,就是要&上101010101010……,
对应十六进制分别是555……和aaa……,
一般我们默认是32位整数,4位对应一位16进制就是8个5,8个a。
通过& 0x55555555的方式拿出奇数位和
& 0xaaaaaaa的方式拿出偶数位。奇
数位左移一位就到了偶数位上,偶数位右移一位就到了奇数位上,最后两个数字或起来,就完成了交换。※这个宏只能完成32位以内的整形,要想完成64位的,那就将5和a的数量翻倍即可。