【C】程序环境和预处理

先搞面包再谈爱

已于 2023-04-05 11:41:28 修改

阅读量205

点赞数

分类专栏： C语言文章标签： c语言

于 2023-04-05 11:38:19 首次发布

本文链接：https://blog.csdn.net/m0_62782700/article/details/129913767

版权

C语言专栏收录该内容

23 篇文章 0 订阅

订阅专栏

文章详细阐述了C语言程序的编译和执行过程，包括翻译环境（编译、预处理、链接）和执行环境。预处理部分讲解了#define定义、宏以及预定义符号如__FILE__和__LINE__。文章还讨论了宏与函数的对比，强调了宏的副作用和类型无关性，并给出了条件编译和头文件包含的实践示例。

摘要由CSDN通过智能技术生成

1.翻译环境和执行环境

在C标准下，任何文件在变成可执行程序时都要经过编译和链接这两个过程，那么这两个过程是存在于编译环境的，还有一个环境叫做执行环境。

两个不同的环境——翻译环境和执行环境。
翻译环境，在这个环境中源代码被转换为可执行的机器指令，此环境下进行编译和链接。
执行环境，它用于实际执行代码。

2.编译和链接

翻译环境

这两个功能是在翻译环境中完成的。

编译又可以再分为三个步骤：预编译（主要进行的是预处理指令），编译（将C语言代码转化为汇编代码，并生成汇编文件），汇编（将汇编代码转化为二进制指令，生成目标文件）。

编译完成后再进行链接

链接主要进行所有obj文件的段表合并、符号表的合并和重定位。就形成了exe可执行文件。

图解如下：
在这里插入图片描述
展示下大概：
预编译，这里将stdio.h，add.h展开到了test.i文件中。

编译：

在这里插入图片描述
汇编：
生成二进制文件（不可查看）

编译、汇编、链接这三个功能中各自的功能是相互关联的。
编译的符号汇总，汇编的形成符号表，链接的符号表的合并和重定位。这三个是逐层递进的。
在这里插入图片描述

在这里插入图片描述

看图解：
在这里插入图片描述

我们计算机语言的发展是：
二进制代码->汇编代码->B语言->C语言（后面的就不说了），从左到右，由低级到高级，我们现在做的就是从高级转到低级，进行预编译，编译和汇编，将C代码转换为二进制的代码。

运行环境

程序执行的过程：

程序必须载入内存中。在有操作系统的环境中：一般这个由操作系统完成。在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
程序的执行便开始。接着便调用main函数。
开始执行程序代码。这个时候程序将使用一个运行时堆栈（stack），存储函数的局部变量和返回地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
终止程序。正常终止main函数；也有可能是意外终止。

3.预处理

预定义符号

__FILE__ ：进行编译的源文件
__LINE__ ：文件当前的行号
__DATE__ ：文件被编译的日期
__TIME__ ：文件被编译的时间
__STDC__ ：如果编译器遵循ANSI C，其值为1，否则未定义

在这里插入图片描述
在vs2019下，__STDC__ 是未定义的。可以看到vs2019不是完全遵循C标准的。

#define

#define的标识符在预编译阶段会被直接替换掉。
看例子：
在这里插入图片描述

#define 定义标识符

语法：
 #define name stuff

有些地方很有用，而有些地方很鸡肋：

#define MAX 1000
#define reg register          //为 register这个关键字，创建一个简短的名字
#define do_forever for(;;)     //用更形象的符号来替换一种实现
#define CASE break;case        //在写case语句的时候自动把 break写上。

个人感觉上面的MAX还是很有用的，但是下面的三个就没有做标识符的必要了。

第二个，会降低代码的可读性，如果别人看你的代码的话，还要先找到reg代表的是什么，而且就少了几个字，没必要这样搞。

第三个，实现了一个死循环，我感觉也没什么用。

第四个，有的语言switch，case语句中没有break语句，所以当有的程序员转到C语言进行编写代码的时候会想到这个歪点子。
在这里插入图片描述

// 如果定义的 stuff过长，可以分成几行写，除了最后一行外，每行的后面都加一个反斜杠(续行符)。

#define DEBUG_PRINT printf("file:%s\tline:%d\t \
                          date:%s\ttime:%s\n" ,\
                          __FILE__,__LINE__ ,\
                          __DATE__,__TIME__ )

\是续行符的意思，可以将一行代码分为多行写。

#define 定义宏

#define 机制包括了一个规定，允许把参数替换到文本中，这种实现通常称为宏（macro）或定义宏（define macro）。

下面是宏的申明方式：

#define name( parament-list ) stuff

其中的 parament-list 是一个由逗号隔开的符号表，它们可能出现在stuff中
注意：
参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分

例如：

#define SQUARE( x ) x * x

当你令x为5时，就会变成 5 * 5 （中间有空格）

其实这个宏存在一个问题：
观察下面的代码段：

int a = 5;
printf("%d\n" ,SQUARE( a + 1) );

结果是36吗？
其实不是，当我们将a+1给x时，是原封不动给的，所以真实的式子是这样的：
5 + 1 * 5 + 1，结果就变成了11。

替换文本时，参数x被替换成a + 1,所以这条语句实际上变成了：
printf ("%d\n",a + 1 * a + 1 );

这样就比较清晰了，由替换产生的表达式并没有按照预想的次序进行求值。
在宏定义上加上两个括号，这个问题便轻松的解决了：

#define SQUARE(x) (x) * (x)

这样预处理之后就产生了预期的效果：

printf ("%d\n",(a + 1) * (a + 1) );

这里还有一个宏定义：

#define DOUBLE(x) (x) + (x)

定义中我们使用了括号，想避免之前的问题，但是这个宏可能会出现新的错误。

int a = 5;
printf("%d\n" ,10 * DOUBLE(a));

这将打印什么值呢？

看上去，好像打印100，但事实上打印的是55.
我们发现替换之后：

printf ("%d\n",10 * (5) + (5));

乘法运算先于宏定义的加法，所以出现了55
这个问题，的解决办法是在宏定义表达式两边加上一对括号就可以了。

#define DOUBLE(x)   ( ( x ) + ( x ) )

所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号，避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。

#define 替换规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤。

在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换。
替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值所替换。
最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。

注意：

宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏，不能出现递归。
当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。

#和##

#的作用
如何把参数插入到字符串中？
我们先来看个例子：
在这里插入图片描述
这两个打印的结果是一样的，所以依据这个，我们就可以写出类似的实现一下上面的问题。

再看一个例子：
在这里插入图片描述
这个例子中，每一次打印都有_的值是____:这几个字符。我们可以用宏来稍微修改一下。

但是这样的话，用函数也可以实现，我们再改改：

我们在num的前面加上了#，就可以把num变成一个字符串，一个num本身的字符串。

在printf里面，#num是字符串，紧接着后面的"的值是:"也是字符串，format也是字符串，这样的话就可以把前面的这些都连在一起打印了。

##的作用

##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。

在这里插入图片描述

带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。

例如：

x+1;//不带副作用
x++;//带有副作用

#define MAX(a, b) ( (a) > (b) ? (a) : (b) )

...
x = 5;
y = 8;
z = MAX(x++, y++);
printf("x=%d y=%d z=%d\n", x, y, z);//输出的结果是什么？

这里我们得知道预处理器处理之后的结果是什么：

z = ( (x++) > (y++) ? (x++) : (y++));

所以结果就是：
x=6 y=10 z=9

但是函数传x++就没事。

int Max(int x. int y)
{
	return ((x++) > (y++) ? (x++) : (y++));
}

这里传参不会影响到外面的实参。

宏和函数对比

宏通常被应用于执行简单的运算。
比如在两个数中找出较大的一个。

#define MAX(a, b) ((a)>(b)?(a):(b))

那为什么不用函数来完成这个任务？

宏的优点:

用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。
所以宏比函数在程序的规模和速度方面更胜一筹。
更为重要的是函数的参数必须声明为特定的类型。
所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于来比较的类型。
宏是类型无关的。

宏的缺点：当然和函数相比宏也有劣势的地方

每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序
的长度。
宏是没法调试的。
宏由于类型无关，也就不够严谨。
宏可能会带来运算符优先级的问题，导致程容易出现错。

宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到。

#define MALLOC(num, type) (type *)malloc(num * sizeof(type))
...
//使用
MALLOC(10, int);//类型作为参数
//预处理器替换之后：
(int *)malloc(10 * sizeof(int));

在这里插入图片描述

命名约定

一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是：

把宏名全部大写
函数名不要全部大写

#undef

这条指令用于移除一个宏定义
例子：
在这里插入图片描述

#undef NAME
//如果现存的一个名字需要被重新定义，那么它的旧名字首先要被移除

命令行定义

许多C 的编译器提供了一种能力，允许在命令行中定义符号。用于启动编译过程。
例如：当我们根据同一个源文件要编译出一个程序的不同版本的时候，这个特性有点用处。（假定某个程序中声明了一个某个长度的数组，如果机器内存有限，我们需要一个很小的数组，但是另外一个机器内存大些，我们需要一个数组能够大些。）

int main()
{
	int array [ARRAY_SIZE];
	int i = 0;
	for(i = 0; i< ARRAY_SIZE; i ++)
	{
	    array[i] = i;
	}
	for(i = 0; i< ARRAY_SIZE; i ++)
	{
	    printf("%d " ,array[i]);
	}
	printf("\n" );
	return 0;
}

编译指令：

//linux 环境演示
gcc -D ARRAY_SIZE=10 programe.c

在这里插入图片描述
这里虽然没有定义，但还是执行了程序。

条件编译

在编译一个程序的时候我们如果要将一条语句（一组语句）编译或者放弃是很方便的。因为我们有条件编译指令。

比如说：
调试性的代码，删除可惜，保留又碍事，所以我们可以选择性的编译。

#include <stdio.h>
#define __DEBUG__
int main()
{
	int i = 0;
	int arr[10] = { 0 };
	for (i = 0; i < 10; i++)
	{
		arr[i] = i;
#ifdef __DEBUG__
		printf("%d ", arr[i]);//为了观察数组是否赋值成功。 
#endif //__DEBUG__
	}
	printf("\n");
	return 0;
}

在这里插入图片描述

1.
#if 常量表达式
 //...
#endif
//常量表达式由预处理器求值。
如：
#define __DEBUG__ 1
#if __DEBUG__
 //..
#endif

2.多个分支的条件编译
#if 常量表达式
 //...
#elif 常量表达式
 //...
#else
 //...
#endif

3.判断是否被定义
//这两个是一个意思
#if defined(symbol)
#ifdef symbol

//这两个是一个意思
#if !defined(symbol)
#ifndef symbol

4.嵌套指令
#if defined(OS_UNIX)
	 #ifdef OPTION1
		 unix_version_option1();
	 #endif
	 #ifdef OPTION2
		 unix_version_option2();
	 #endif
#elif defined(OS_MSDOS)
	 #ifdef OPTION2
	 	msdos_version_option2();
	 #endif
#endif

头文件包含

头文件被包含的方式

我们已经知道， #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。

这种替换的方式很简单：
预处理器先删除这条指令，并用包含文件的内容替换。
这样一个源文件被包含10次，那就实际被编译10次。

本地文件包含

#include "filename"

查找策略：先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。

库文件包含

#include <filename.h>

查找头文件直接去标准路径下去查找，如果找不到就提示编译错误。

这样是不是可以说，对于库文件也可以使用 " " 的形式包含？
答案是肯定的，可以。
但是这样做查找的效率就低些，当然这样也不容易区分是库文件还是本地文件了。

嵌套文件包含

如果出现这样的场景：
在这里插入图片描述

comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复。

如何解决这个问题？
答案：条件编译。

每个头文件的开头写：

#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif   //__TEST_H__

或者：

#pragma once

这两个都可以，有的编译器会自动加，比如vs2019就会在头文件中自动加上#pragma once

4.其他

#error
#pragma
#line
等等预处理指令，感兴趣的自己去了解就行。

结束。

先搞面包再谈爱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录