15C语言预处理

最新推荐文章于 2023-08-16 18:30:44 发布

今天也要写bug、

最新推荐文章于 2023-08-16 18:30:44 发布

阅读量409

点赞数 6

分类专栏： C语言文章标签： c语言

本文链接：https://blog.csdn.net/qq_52670477/article/details/119114794

版权

C语言专栏收录该内容

31 篇文章 9 订阅

订阅专栏

本章是C语言的最后一章，在这一章将带大家了解一下程序是如何从代码生成可执行程序的，也就是如何从.c文件到.exe文件。

文章目录

一、程序的翻译环境和执行环境
二、预处理（预编译）详解

一、程序的翻译环境和执行环境

程序从.c文件到.exe文件依赖的是翻译环境，而.exe以后的执行依赖的是执行环境

1.1翻译环境

在这个环境中，我们写的源代码被翻译成可执行的机器指令（二进制信息），也就是说，翻译环境将文本文件（.c文件）转换成二进制文件（.exe），当存在多个.c文件时，会单独生成它们对应的目标文件，最后再链接成一个可执行文件。

在这里插入图片描述

在上面的过程中，由编译器处理的过程叫做编译，有链接器处理的过程叫做链接。

组成一个程序的每个源文件通过编译过程分别转换成目标代码（object code）。
每个目标文件由链接器（linker）捆绑在一起，形成一个单一而完整的可执行程序。
链接器同时也会引入标准C函数库中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中。

也就是说在链接时，链接器会将库函数的静态库与目标文件进行链接，这样我们才能使用库函数。

以之前的扫雷文件为例：
在这里插入图片描述

在这里插入图片描述

1.1.1编译的过程

编译又分为预编译（预处理）、编译、汇编三个过程。

预编译阶段大致分为以下操作：

#include头文件的包含，会将头文件中的内容拷贝一份
删除注释，使用空格替换注释
#define替换操作
条件编译

预处理：相当于根据预处理指令组装新的C/C++程序。经过预处理，会产生一个没有头文件（都已经被展开了）、宏定义（都已经替换了），没有条件编译指令（该屏蔽的都屏蔽掉了），没有特殊符号的输出文件，这个文件的含义同原本的文件无异，只是内容上有所不同。

编译：将预处理完的文件逐一进行一系列词法分析、语法分析、语义分析及优化后，产生相应的汇编代码文件。编译是针对单个文件编译的，只校验本文件的语法是否有问题，不负责寻找实体。

链接：通过链接器将一个个目标文件（或许还会有库文件）链接在一起生成一个完整的可执行程序。链接程序的主要工作就是将有关的目标文件彼此相连接，也就是将在一个文件中引用的符号同该符号在另外一个文件中的定义连接起来，使得所有的这些目标文件成为一个能够被操作系统装入执行的统一整体。在此过程中会发现被调用的函数未被定义。需要注意的是，链接阶段只会链接调用了的函数/全局变量，如果存在一个不存在实体的声明（函数声明、全局变量的外部声明），但没有被调用，依然是可以正常编译执行的。

总之预编译阶段的操作为文本操作，操作结束以后生成.i的文本文件。

编译阶段则进行语法检查，将C语言代码翻译成汇编代码，进行的操作有语法分析、词法分析、语义分析、符号汇总等，一般情况下如果语法有错误都会在这一步报错。翻译完成以后生成.s文件。

汇编阶段将汇编代码转化成二进制代码，并且形成符号表。完成后生成.o文件

1.1.2链接的过程

在编译阶段完成以后会生成多个.obj的文件，在链接阶段，链接器进行合并段表、符号表的合并和符号表的重定位等操作，将多个.obj文件链接在一起，生成一个.exe可执行文件。

综上，上述的翻译过程如图所示：
在这里插入图片描述

1.2执行环境

程序执行的过程：

程序必须载入内存中。在有操作系统的环境中：一般这个由操作系统完成。在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
程序的执行便开始。接着便调用main函数。
开始执行程序代码。这个时候程序将使用一个运行时堆栈（stack），存储函数的局部变量和返回地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
终止程序。正常终止main函数；也有可能是意外终止。

二、预处理（预编译）详解

2.1预定义符号

C语言中有很多已经定义好的符号，可以直接拿来使用：

__FILE__      //进行编译的源文件
__LINE__     //文件当前的行号
__DATE__    //文件被编译的日期
__TIME__    //文件被编译的时间
__STDC__    //如果编译器遵循ANSI C，其值为1，否则未定义

在这里插入图片描述

这些符号可以用来写日志文件。

2.2#define

#define在之前提到过，这里再进行一些补充。

由于#define是完全替换的，因此可以用来定义标识符：

#define MAX 1000
#define reg register          //为 register这个关键字，创建一个简短的名字
#define CASE break;case        //在写case语句的时候自动把 break写上。
//给函数创建一个简短的名字
#define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n" ,
                          __FILE__,__LINE__ , __DATE__,__TIME__ )

由于#define是直接替换的，因此在定义标识符的时候，最好不要加标点，否则很容易出错，比如：

#define MAX 1000;
int main()
{
    int i;
    i = MAX;
    printf("%d",MAX);//替换以后相当于 printf("%d",1000;)，会出现语法错误
}

#define 还可以定义宏

#define 机制包括了一个规定，允许把参数替换到文本中，这种实现通常称为宏（macro）或定义宏（definemacro）。

下面是宏的申明方式：

#define name( parament-list ) stuff 其中的 parament-list 是一个由逗号隔开的符号表，它们可能出现在stuff中。
注意：参数列表的左括号必须与name紧邻。如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分。

对于一些比较简单的函数，可以用宏定义来实现：

#define ADD(a,b) a+b
#include<stdio.h>
int main()
{
	int i = 3, j = 4;
	int ret = ADD(i, j);
	printf("%d", ret);

	return 0;
}

在这里插入图片描述

这个宏接收参数 a和b以后 .预处理器就会将ADD(i+j)替换为i+j。
由于是直接替换，因此会存在一些问题：
在这里插入图片描述

比如在这个程序中4*ADD(i+j)会被直接替换为4*i+j，相比于函数传参，宏是直接完成替换，因此为了避免发生错误要加上括号：

#define ADD(a,b)  ((a)+(b))
#define DOUBLE(x) ( (x) + (x) )

#define 替换规则：

在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换。
替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值替换。
最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。

注意：

宏参数和#define 定义中可以出现其他#define定义的变量。但是对于宏，不能出现递归。
当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。

2.3#和##

#可以在宏定义中，把参数替换到字符串中：

#include<stdio.h>
#define PRINT(X) printf("the value of " #X " is %d\n", X)
int main()
{
	int a = 10;
	int b = 20;
	PRINT(a);
	PRINT(b);
	
	return 0;
}

在这里插入图片描述

##可以将位于它两端的字符串合在一起

#include<stdio.h>
#define ADD_TO_SUM(num, value)  sum##num += value;
int main()
{
	int sum5 = 0;
	ADD_TO_SUM(5, 10);
	printf("%d", sum5);
	return 0;
}

在这里插入图片描述

sum##num会被合并成sum5

2.4宏和函数对比

宏一般用于执行简单的运算。
相比于函数，宏有以下的优势：

函数的调用是有开销的。所以宏比函数在程序的规模和速度方面更胜一筹。
更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。

宏也有以下的劣势：

每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序的长度。
宏是没法调试的。
宏由于类型无关，也就不够严谨。
宏可能会带来运算符优先级的问题，导致程容易出现错。

宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到。

#define MALLOC(num, type) (type *)malloc(num * sizeof(type)) 
//使用
MALLOC(10, int);//类型作为参数
//预处理器替换之后：
(int *)malloc(10 * sizeof(int));

属性	#define定义宏	函数
代码长度	每次使用时，宏代码都会被插入到程序中。除了非常小的宏之外，程序的长度会大幅度增长	函数代码只出现于一个地方；每次使用这个函数时，都调用那个地方的同一份代码
执行速度	更快	存在函数的调用和返回的额外开销，所以相对慢一些
操作符优先级	宏参数的求值是在所有周围表达式的上下文环境里，除非加上括号，否则邻近操作符的优先级可能会产生不可预料的后果，所以建议宏在书写的时候多些括号。	函数参数只在函数调用的时候求值一次，它的结果值传递给函数。表达式的求值结果更容易预测。
带有副作用的参数	参数可能被替换到宏体中的多个位置，所以带有副作用的参数求值可能会产生不可预料的结果。	函数参数只在传参的时候求值一次，结果更容易控制。
参数类型	宏的参数与类型无关，只要对参数的操作是合法的，它就可以使用于任何参数类型。	函数的参数是与类型有关的，如果参数的类型不同，就需要不同的函数，即使他们执行的任务是不同的。
调试	宏是不方便调试的	函数是可以逐语句调试的
递归	宏不能递归	函数可以递归

为了将宏和函数进行区分：一般把宏名全部大写，函数名不要全部大写。

2.4.1利用宏计算结构体中某变量相对于首地址的偏移量

之前已经学过计算结构体中某变量相对于首地址的偏移量了：

#include<stdio.h>
struct S1
{
	char c1;
	int i;
	char c2;

}s;
int main()
{
	printf("%d\n", (char*)(&s.i) - (char*)(&s));

	return 0;
}

这次模拟实现宏offsetof来计算这个偏移量：

#include<stdio.h>
#define OFFSETOF(struct_name, member_name) (int)&(((struct_name*)0)->member_name)
struct S
{
	char c1;
	int a;
	char c2;
};
int main()
{
	//struct S s;
	printf("%d\n", OFFSETOF(struct S, c1));
	printf("%d\n", OFFSETOF(struct S, a));
	printf("%d\n", OFFSETOF(struct S, c2));
	return 0;
}

在这里插入图片描述

这个宏将地址空间为0的内存地址作为一个结构体的首地址，找到结构体对应的成员变量，然后取地址得到这个成员变量的地址，再把这个地址强转为int型。由于结构体的首地址是0，所以结构体成员的偏移量就是结构体成员自己的地址。

2.5#undef移除宏定义

这条指令用于移除一个宏定义。
在这里插入图片描述

2.6条件编译

条件编译可以实现如果一个宏有定义，那么其中的代码就会参与编译，否则则不会参与编译：

#include <stdio.h> 
//#define __DEBUG__ 
int main()
{
	int i = 0;
	int arr[10] = { 0 };
	for (i = 0; i < 10; i++)
	{
		arr[i] = i;
#ifdef __DEBUG__ 
		printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 
#endif 
	}

		return 0;
}

在这里插入图片描述

常见的条件编译指令：

#if 常量表达式
 //... 
#endif 
//常量表达式由预处理器求值。

#define __DEBUG__ 1 
#if __DEBUG__ 
 //.. 
#endif

在这里插入图片描述
多个分支的条件编译：


#if 常量表达式
 //... 
#elif 常量表达式
 //... 
#else 
 //... 
#endif

在这里插入图片描述

判断是否被定义

#if defined(symbol) 
//如果symbol定义了，则中间的代码参与编译
#endif

#ifdef
//如果symbol定义了，则中间的代码参与编译
#endif


#if !defined(symbol) 
//如果symbol没有定义，则中间的代码参与编译
#endif

#ifndef
//如果symbol没有定义，则中间的代码参与编译
#endif

嵌套指令（类似于if语句嵌套）：

#if defined(OS_UNIX) 
  #ifdef OPTION1 
  unix_version_option1(); 
  #endif 
  #ifdef OPTION2 
  unix_version_option2(); 
  #endif 
#elif defined(OS_MSDOS) 
  #ifdef OPTION2 
  msdos_version_option2(); 
  #endif 
#endif

2.7文件包含

#include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。
这种替换的方式很简单：预处理器先删除这条指令，并用包含文件的内容替换。这样一个源文件被包含10次，那就实际被编译10次。

头文件被包含的方式

本地文件

#include "filename"

这种包含方式方式：编译器会先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。如果找不到就提示编译错误。

库文件

#include <filename.h>

查找头文件直接去标准路径下去查找，如果找不到就提示编译错误。

因此本地文件的查找方式比库文件的查找范围更广，因此库文件也可以使用本地文件的查找方式，但是这样查找效率会非常低，如果代码量多，那么编译时间就会很长。

如果头文件被重复包含，那么头文件就会被重复编译，效率非常低，为了解决这种情况可以使用条件编译指令：

#ifndef __TEST_H__ 
#define __TEST_H__ 
//头文件的内容
#endif //__TEST_H__

或者

#pragma once
//头文件的内容

今天也要写bug、

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录