超详细!程序预处理的过程

你帅你先说.

已于 2022-10-19 16:32:21 修改

阅读量677

点赞数 15

分类专栏： C语言文章标签： c语言

于 2021-10-10 14:49:16 首次发布

本文链接：https://blog.csdn.net/qq_52363432/article/details/120629106

版权

C语言专栏收录该内容

15 篇文章 5 订阅

订阅专栏

本文详细介绍了C语言的程序翻译环境、执行环境、编译和链接过程，特别是预处理的概念，包括预定义符号、#define、#undef、条件编译和文件包含。此外，还对比了宏与函数的优缺点，并提供了实际代码示例进行说明。

摘要由CSDN通过智能技术生成

●🧑个人主页:你帅你先说.
●📃欢迎点赞👍关注💡收藏💖
●📖既选择了远方，便只顾风雨兼程。
●🤟欢迎大家有问题随时私信我！
●🧐版权：本文由[你帅你先说.]原创，CSDN首发，侵权必究。

1. 程序的翻译环境和执行环境

在ANSIC的任何一种实现中，存在两个不同的环境。

第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境，它用于实际执行代码。

这样说太抽象了，我们用图来解释。
在这里插入图片描述

2. 详解编译+链接

2.1 翻译环境

在这里插入图片描述

组成一个程序的每个源文件通过编译过程分别转换成目标代码（object code）。
每个目标文件由链接器（linker）捆绑在一起，形成一个单一而完整的可执行程序。
链接器同时也会引入标准C函数库中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中。

2.2编译阶段

直接看代码
test.c

#include <stdio.h>
extern int Add(int x, int y);
int main()
{
	int a = 10;
	int b = 20;
	int ret = 0;
	ret = Add(a, b);
	printf("ret = %d\n", ret);

	return 0;
}

add.c

int Add(int x, int y)
{
	return x + y;
}

接下来我们图解这段程序发生了什么
在这里插入图片描述

这边只是对这些过程进行个粗略的讲解，想了解详细过程的可以看《程序员的自我修养》这本书，这里边对这些过程讲解的非常细致。

2.3运行环境

程序执行的过程：

程序必须载入内存中。在有操作系统的环境中：一般这个由操作系统完成。在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
程序的执行便开始。接着便调用main函数。
开始执行程序代码。这个时候程序将使用一个运行时堆栈（stack），存储函数的局部变量和返回地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
终止程序。正常终止main函数；也有可能是意外终止。

3. 预处理详解

3.1 预定义符号

FILE //进行编译的源文件
LINE //文件当前的行号
DATE //文件被编译的日期
TIME //文件被编译的时间
STDC //如果编译器遵循ANSI C，其值为1，否则未定义

举个🌰:
在这里插入图片描述

3.2 #define

3.2.1定义标识符

这个操作我们已经很熟悉了，前面的文章都有讲到，这里不再次讲解。
这里来说几个比较特别的定义

#define reg register //为 register这个关键字，创建一个简短的名字
#define do_forever for() //用更形象的符号来替换一种实现
#define CASE break;case //在写case语句的时候自动把 break写上。
// 如果定义的 stuff过长，可以分成几行写，除了最后一行外，每行的后面都加一个反斜杠(续行符)。
#define DEBUG_PRINT
printf("file:%s\tline:%d\t \
date:%s\ttime:%s\n" ,\
FILE,LINE , \
DATE,TIME )

💡:
在定义标识符常量的时候注意，结尾不要加;,例如，#define MAX 100； 此时在替换的过程中会把所有的MAX都替换成 100;，替换后的语句就会出现两个分号的情况。

3.2.2定义宏

下面是宏的申明方式：

#define name( parament-list ) stuff

其中的 parament-list 是一个由逗号隔开的符号表，它们可能出现在stuff中。
例如

#define SQUARE( x ) (x) * (x)

SQUARE( 5 );

这个时候编译器里就会计算 5*5

最终就会得到结果25
我相信肯定有人会疑惑为什么两个x要加()，举个🌰。

#define SQUARE( x ) x*x
int main()
{
	int a=5
	printf("%d",SQUARE(a+1));
}
此时编译器里的计算是这样的
5+1*5+1
所以加上()保证传进去的参数是一个整体。

3.2.3#define 替换规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤。

在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换。
替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值替换。
最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。

💡:
1. 宏参数和#define 定义中可以出现其他#define定义的变量。但是对于宏，不能出现递归。
2. 当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。

3.2.4#和##

先说说#，#是把一个宏参数变成对应的字符串。

#define PRINT(n) printf("the value of "#n" is %d\n", n)
int main()
{
	int a = 10;
	PRINT(a);
	此时#n会被替换成字符串"a",最终结果是the value of a is 10
	int b = 20;
	PRINT(b);
	此时#n会被替换成字符串"b",最终结果是the value of a is 20
	return 0;
}

再来说##，##可以把位于它两边的符号合成一个符号。
举个🌰:
在这里插入图片描述

3.2.5 带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:

x+1;//不带副作用
x++;//带有副作用

#define MAX(X,Y) ((X)>(Y)?(X):(Y))
int main()
{
	int a = 5;
	int b = 8;
	//宏的参数是不计算直接替换进去的
	//替换进去进去后参与运算
	int m = MAX(a++, b++);
	//int m = MAX(a++, b++);
	//int m = ((a++) > (b++) ? (a++) : (b++));
	//           5       8       6       9
	//所以最终b相当于++了两次,最终b是10
	return 0;
}

3.2.6宏和函数对比

#define MAX(a, b) ((a)>(b)?(a):(b))

以刚刚这个例子为例
虽然存在副作用，但这里用宏来实现比函数更好。

1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏可以适用于整形、长整型、浮点型等可以用来比较的类型。宏是类型无关的。

当然和宏相比函数也有劣势的地方:

每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序的长度。
宏是没法调试的。
宏由于类型无关，也就不够严谨。
宏可能会带来运算符优先级的问题，导致程序容易出现错误。

但宏有自己可以做到函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到。
举个🌰:

#define MALLOC(num, type) \
	(type*)malloc(num*sizeof(type))

int main()
{
	int* p = MALLOC(100, int);
	//int* p = (int*)malloc(100 * sizeof(int));
	return 0;
}

宏和函数的一个对比
在这里插入图片描述
命名约定
一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是：

把宏名全部大写
函数名不要全部大写

3.3#undef

这条指令用于移除一个宏定义。

#undef NAME
//如果现存的一个名字需要被重新定义，那么它的旧名字首先要被移除。

3.4 命令行定义

许多C 的编译器提供了一种能力，允许在命令行中定义符号。用于启动编译过程。
例如：当我们根据同一个源文件要编译出不同的一个程序的不同版本的时候，这个特性有点用处。（假定某个程序中声明了一个某个长度的数组，如果机器内存有限，我们需要一个很小的数组，但是另外一个机器内存大写，我们需要一个数组能够大写。）

#include <stdio.h>
int main()
{
    int array [SZ];
    int i = 0;
    for(i = 0; i< SZ; i ++)
   {
        array[i] = i;
   }
    for(i = 0; i< SZ; i ++)
   {
        printf("%d " ,array[i]);
   }
    printf("\n" );
    return 0; }

编译指令

gcc -D SZ=10 programe.c

3.5条件编译

满足条件才进行编译

int main()
{
#if 1   //条件为真才进行编译
	printf("hello world\n");
#endif
	return 0;
}

常见的条件编译指令:

1.
#if 常量表达式
 //...
#endif
//常量表达式由预处理器求值。
如：
#define __DEBUG__ 1
#if __DEBUG__
 //..
#endif
2.多个分支的条件编译
#if 常量表达式
 //...
#elif 常量表达式
 //...
#else
 //...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#if defined(OS_UNIX)
 #ifdef OPTION1
 unix_version_option1();
 #endif
 #ifdef OPTION2
 unix_version_option2();
 #endif
#elif defined(OS_MSDOS)
 #ifdef OPTION2
 msdos_version_option2();
 #endif
#endif

3.6 文件包含

本地文件包含

#include "filename"

查找策略:先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。
库文件包含

#include <filename.h>

查找策略:查找头文件直接去标准路径下去查找，如果找不到就提示编译错误。
按照这个逻辑，那么库文件的包含是不是也可以用" "，答案是可以的，但不推荐，这样做查找的效率就低些，当然这样也不容易区分是库文件还是本地文件了。

嵌套文件包含
在这里插入图片描述
comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复。
那要怎么解决呢？
第一种方法是条件编译

#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif   //__TEST_H__

第二种方法

#pragma once

就可以避免头文件的重复引入。

看到这，全部内容就讲完了。

离开前，别忘了点赞👍关注💡收藏💖(长按👍可一键三连，别白嫖了，球球了)
请添加图片描述

你帅你先说.

关注

15
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
9
评论
超详细!程序预处理的过程

1. 程序的翻译环境和执行环境在ANSIC的任何一种实现中，存在两个不同的环境。第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令。第2种是执行环境，它用于实际执行代码。这样说太抽象了，我们用图来解释。2. 详解编译+链接2.1 翻译环境组
复制链接

扫一扫