文章目录
程序的翻译环境和执行环境
在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境,它用于实际执行代码。
详解编译+链接
翻译环境
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人
的程序库,将其需要的函数也链接到程序中。
编译的过程
sum.c
int g_val = 2016;
void print(const char *str)
{
printf("%s\n", str);
}
test.c
#include <stdio.h>
int main()
{
extern void print(char *str);
extern int g_val;
printf("%d\n", g_val);
print("hello bit.\n");
return 0;
}
函数只有声明的时候,在test.c中是没有给 _ sum函数分配地址的,在_sum函数中定义的sum.c中才记录有 _ sum 函数的地址,在链接时,会有符号表的合并和符号表的重定位,这也为什么即使我们没有声明函数直接调用定义在另一个源文件中的函数,也仍能够跑起来,并且只是弹出警告的原因。
接下来我们在linux下一步一步看发生了什么
预处理
运行如上简单程序。
可以看到当前目录下只有test.c
文件
使用gcc -E test.c -o test.i
预处理命令
并将产生的的结果放在test.i
中,可以看到我们本目录下多了一个test.i
文件,我们来看看其中的内容。
文件内容略长,我们仅仅看开头和结尾,开头是头文件的包含内容,包括链接库的路径等等。
结尾就是我们所写的函数了可以看到被处理的仅仅是预处理指定 #include
。
编译
使用gcc -S test.i -o test.s
编译命令
并且将结果输出到test.s
文件
接下来看看这个文件是什么?
嗯~这里已经没有那么多的文件内容了,不懂没关系,大致能看出来这是汇编指令了。
那么说明这里是将程序编译为汇编语言。
汇编
同样的执行gcc -c test.s -o test.o
汇编指令
汇编完成之后就停下来,结果保存在test.o
中,看到test.o已经存在了。
继续进入test.o
中查看:
这下谁也看不懂了,因为汇编会将汇编语言编程机器二进制语言,而我们使用的是文本编辑器,所以都是乱码。
那么这个test.o
可以直接运行吗,试一下:
没有权限,并且这被当作是一个普通文件,并不是可执行文件。
使用gcc -o test test.o
命令,继续看看,我们通过test.o
生成了一个test可执行文件。
执行结果:
我们的hello linux!
就输出到我们的屏幕上了。
运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。 - 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回
地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程
一直保留他们的值。 - 终止程序。正常终止main函数;也有可能是意外终止。
程序载入内存中可以简单想象为将变量数据将函数指令等,载入内存中某个特定的位置,并记录这个地址,让我们运行程序时可以根据需要访问这些地址上存储的指令或者数据。
预处理详解
预处理符号
__FILE__ //进行编译的源文件
__LINE__ //文件当前的行号
__DATE__ //文件被编译的日期
__TIME__ //文件被编译的时间
__STDC__ //如果编译器遵循ANSI C,其值为1,否则未定义
这些预定义符号都是语言内置的。
例子:
printf("file:%s line:%d\n", __FILE__, __LINE__);
所在的文件,以及文件当前的行号就被打印出来了。
#define
#define定义标识符
例子:
#define MAX 1000 //预处理过程中会将MAX替换成1000
#define reg register //为 register这个关键字,创建一个简短的名字
#define do_forever for(;;) //用更形象的符号来替换一种实现
#define CASE break;case //在写case语句的时候自动把 break写上。
// 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
date:%s\ttime:%s\n" ,\
__FILE__,__LINE__ , \
__DATE__,__TIME__ )
问题来了,通常一个语句末尾会加上 ;
,那么这里需要加上吗?
比如:
#define MAX