编译和链接
一、翻译环境和运行环境
1.1、翻译环境
如果再把编译器展开成3个过程,那就变成了下面的过程:
1.1.1、 预处理(预编译)
在预处理阶段,源文件和头文件会被处理成为.i为后缀的文件。
在 gcc 环境下想观察⼀下,对 test.c 文件预处理后的.i文件,命令如下:
gcc -E test.c -o test.i
预处理阶段主要处理那些源文件中#开始的预编译指令。⽐如:#include,#define,处理的规则如下:
1.1.2、编译
编译过程的命令如下:
gcc -S test.i -o test.s
对下面代码进行编译的时候,会怎么做呢?假设有下面的代码:
array[index] = (index+4)*(2+6);
1.1.2.1、词法分析:
上面程序进行词法分析后得到了16个记号:
1.1.2.2、语法分析
1.1.2.3、语义分析
1.1.3、汇编
汇编的命令如下:
gcc -c test.s -o test.o
1.1.4、链接
test.c
#include <stdio.h>
//test.c
//声明外部函数
extern int Add(int x, int y);
//声明外部的全局变量
extern int g_val;
int main()
{
int a = 10;
int b = 20;
int sum = Add(a, b);
printf("%d\n", sum);
return 0;
}
add.c
int g_val = 2022;
int Add(int x, int y)
{
return x + y;
}
我们已经知道,每个源文件都是单独经过编译器处理生成对应的目标文件。
1.2、运行环境
预处理详解
一、预定义符号
C语言设置了⼀些预定义符号,可以直接使用,预定义符号也是在预处理期间处理的。
__FILE__ //进行编译的源文件__LINE__ // 文件当前的行号__DATE__ //文件被编译的日期__TIME__ //文件被编译的时间__STDC__ // 如果编译器遵循 ANSI C ,其值为 1 ,否则未定义
举个例子:
printf("file:%s line:%d\n", __FILE__, __LINE__);
二、#define定义常量
基本语法:#define name stuff
举个例子:
# define MAX 1000# define reg register // 为 register 这个关键字,创建⼀个简短的名字# define do_forever for( ; ; ) // 用更形象的符号来替换⼀种实现# define CASE break;case // 在写 case 语句的时候自动把 break 写上。// 如果定义的 stuff 过长,可以分成几行写,除了最后一行外,每行的后面都加⼀个反斜杠 ( 续行符 ) 。# define DEBUG_PRINT printf( "file:%s\tline:%d\t \date:%s\ttime:%s\n" ,\__FILE__,__LINE__ , \__DATE__,__TIME__ )
续行符相当于转义字符,将'\n'转义,将换行符转义后换行将不再是换行而是变成一行。
思考:在define定义标识符的时候,要不要在最后加上 ; ?
比如:
# define MAX 1000;# define MAX 1000
建议不要加上 ; ,这样容易导致问题。
比如下面的场景:
if (condition)max = MAX;elsemax = 0 ;
三、#define定义宏
下面是宏的申明方式:
#define name( parament-list ) stuff
其中的 parament-list 是⼀个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
举例:
#define SQUARE( x ) x * x
警告:
int a = 5 ;printf ( "%d\n" ,SQUARE( a + 1 ) );
printf ("%d\n",a + 1 * a + 1 );
#define SQUARE(x) (x) * (x)
这样预处理之后就产生了预期的效果:
printf ("%d\n",(a + 1) * (a + 1) );
这里还有⼀个宏定义:
#define DOUBLE(x) (x) + (x)
定义中我们使用了括号,想避免之前的问题,但是这个宏可能会出现新的错误。
int a = 5 ;printf ( "%d\n" , 10 * DOUBLE(a));
printf ("%d\n",10 * (5) + (5));
乘法运算先于宏定义的加法,所以出现了 55。
这个问题,的解决办法是在宏定义表达式两边加上⼀对括号就可以了。
#define DOUBLE( x ) ( ( x ) + ( x ) )
提示:
四、带有副作用的宏参数
例如:
x+ 1 ; // 不带副作用x++; // 带有副作用
MAX宏可以证明具有副作用的参数所引起的问题。
# define MAX(a, b) ( (a) > (b) ? (a) : (b) )...x = 5 ;y = 8 ;z = MAX(x++, y++);printf ( "x=%d y=%d z=%d\n" , x, y, z); // 输出的结果是什么?
这里我们得知道预处理器处理之后的结果是什么:
z = ( (x++) > (y++) ? (x++) : (y++));
所以输出的结果是:x=6 y=10 z=9
五、宏替换的规则
在程序中扩展#define定义符号和宏时,需要涉及几个步骤。
注意:
六、宏函数的对比
#define MAX(a, b) ((a)>(b)?(a):(b))
那为什么不用函数来完成这个任务?
原因有⼆:
和函数相比宏的劣势:
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到。
# define MALLOC(num, type)\(type )malloc(num * sizeof(type))...// 使用MALLOC( 10 , int ); // 类型作为参数// 预处理器替换之后:( int ) malloc ( 10 * sizeof ( int ));
宏和函数的⼀个对比:
七、#和##
7.1、#运算符
#define PRINT(n) printf("the value of "#n " is %d", n);
当我们按照下面的方式调用的时候:
printf ( "the value of " "a" " is %d" , a);
运行代码就能在屏幕上打印:
the value of a is 10
7.2、## 运算符
比如:
int int_max ( int x, int y){return x>y?x:y;}float float_max ( float x, float y){return x>y?x:y;}
但是这样写起来太繁琐了,现在我们这样写代码试试:
// 宏定义# define GENERIC_MAX(type) \type type##_max(type x, type y)\{ \return (x>y?x:y); \}
使用宏,定义不同函数:
GENERIC_MAX( int ) // 替换到宏体内后 int##_max 生成了新的符号 int_max 做函数名GENERIC_MAX( float ) // 替换到宏体内后 float##_max 生成了新的符号 float_max 做函数名int main (){//调用函数int m = int_max( 2 , 3 );printf ( "%d\n" , m);float fm = float_max( 3.5f , 4.5f );printf ( "%f\n" , fm);return 0 ;}
输出:
在实际开发过程中##使用的很少,很难取出非常贴切的例子。
八、命名约定
九、#undef
这条指令用于移除⼀个宏定义。
十、命令行定义
# include <stdio.h>int main (){int array [ARRAY_SIZE];int i = 0 ;for (i = 0 ; i< ARRAY_SIZE; i ++){array [i] = i;}for (i = 0 ; i< ARRAY_SIZE; i ++){printf ( "%d " , array [i]);}printf ( "\n" );return 0 ;}
编译指令:
//linux 环境演示gcc -D ARRAY_SIZE= 10 programe.c
十一、条件编译
比如说:
调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。
#include <stdio.h>
#define __DEBUG__
int main()
{
int i = 0;
int arr[10] = { 0 };
for (i = 0; i < 10; i++)
{
arr[i] = i;
#ifdef __DEBUG__
printf("%d\n", arr[i]);//为了观察数组是否赋值成功。
#endif //__DEBUG__
}
return 0;
}
常见的条件编译指令:
1.# if 常量表达式//...# endif// 常量表达式由预处理器求值。如:# define __DEBUG__ 1# if __DEBUG__//..# endif2. 多个分支的条件编译# if 常量表达式//...# elif 常量表达式//...# else//...# endif3. 判断是否被定义# if defined(symbol)# ifdef symbol# if !defined(symbol)# ifndef symbol4. 嵌套指令# if defined(OS_UNIX)# ifdef OPTION1unix_version_option1();# endif# ifdef OPTION2unix_version_option2();# endif# elif defined(OS_MSDOS)# ifdef OPTION2msdos_version_option2();# endif# endif
十二、头文件的包含
12.1、头文件被包含的方式:
12.1.1、本地文件包含
#include "filename"
Linux环境的标准头文件的路径:
/usr/include
VS环境的标准头文件的路径:
C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include// 这是 VS2013 的默认路径
注意按照自己的安装路径去找。
12.1.2、库文件包含
#include <filename.h>
12.2、嵌套文件包含
test.c
#include "test.h"
#include "test.h"
#include "test.h"
#include "test.h"
#include "test.h"
int main()
{
return 0;
}
void test();
struct Stu
{
int id;
char name[20];
};
每个头文件的开头写:
# ifndef __TEST_H__# define __TEST_H__// 头⽂件的内容# endif //__TEST_H__或者# pragma once
就可以避免头文件的重复引入。
十三、其他预处理指令
# error# pragma# line...不做介绍,自己去了解。# pragma pack() 在结构体部分介绍。
参考《C语言深度解剖》学习