C语言编译过程详解

最新推荐文章于 2024-09-11 15:41:15 发布

小菜鸡的蜕变之路

最新推荐文章于 2024-09-11 15:41:15 发布

阅读量2.9k

点赞数 9

分类专栏： C学习中的困惑文章标签： C语言编译过程

C学习中的困惑专栏收录该内容

13 篇文章 1 订阅

订阅专栏

IDE的使用让很多和我一样的人对C/C++可执行程序的底层生成一知半解，不利于我们深入理解原理。在这里小结一下，望路过的大神指正~

前言：从一个源文件（.c文件）到可执行程序到底经历了哪几步，我想很多人都知道，但是每一步具体做了什么，估计很多像我一样的人就不能说的清清楚楚，明明白白了。

C语言编译过程分成四个步骤：
1，由.c文件到.i文件，这个过程叫预处理
2，由.i文件到.s文件，这个过程叫编译
3，由.s文件到.o文件，这个过程叫汇编
4，由.o文件到可执行文件，这个过程叫链接

编辑一个小程序，hello.c

#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("hello world!\n");
return 0;
}

1、预处理

预处理过程实际上是处理“#”的过程：#include包含的头文件直接拷贝到hello.c中；#define定义的宏定义进行替换，同时删除代码中没有的注释部分...

具体做的事儿如下：

（1）将所有的#define删除，并且展开所有的宏定义。说白了就是字符替换

（2）处理所有的条件编译指令，#ifdef #ifndef #endif等，就是带#的那些

（3）处理#include，将#include指向的文件插入到该行处

（4）删除所有注释

（5）添加行号和文件标示，这样的在调试和编译出错的时候才知道是是哪个文件的哪一行

（6）保留#pragma编译器指令，因为编译器需要使用

gcc -E hello.c -o a.c 可以生成预处理以后的文件，通过查看文件内容和文件大小可以得知a.c将stdio.h和stdlib.h包含了进来。一下是在Ubuntu上编译后的文件：

drwxrwxr-x 2 lpq lpq 4096 1月 10 10:21 ./
drwxrwxr-x 4 lpq lpq 4096 1月 10 10:19 ../
-rw-rw-r-- 1 lpq lpq 42194 1月 10 10:21 a.c
-rw-rw-r-- 1 lpq lpq 95 1月 10 10:21 hello.c

2、编译

编译的过程实质上是将高级语言翻译成机器语言的过程，即对a.c做了这些事：

（1）词法分析

（2）语法分析

（3）语义分析

（4）优化后生成相应的汇编代码

注：高级语言——>汇编语言——>机器语言（二进制）

gcc -S hello.c -o a.s 可以生成汇编代码，汇编代码如下：

     .file   "hello.c"
 2         .section        .rodata
 3 .LC0:
 4         .string "hello world!"
 5         .text
 6         .globl  main
 7         .type   main, @function
 8 main:
 9 .LFB0:
10         .cfi_startproc
11         pushl   %ebp
12         .cfi_def_cfa_offset 8
13         .cfi_offset 5, -8
14         movl    %esp, %ebp
15         .cfi_def_cfa_register 5
16         andl    $-16, %esp
17         subl    $16, %esp
18         movl    $.LC0, (%esp)
19         call    puts
20         movl    $0, %eax
21         leave
22         .cfi_restore 5
23         .cfi_def_cfa 4, 4
24         ret 
25         .cfi_endproc
26 .LFE0:
27         .size   main, .-main
28         .ident  "GCC: (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3"
29         .section        .note.GNU-stack,"",@progbits

复制代码