简单编译
- 编写一个简单的小程序,取名hello.c
#include<stdio.h>
int main(void)
{
printf("hello my superhero!\n");
return 0;
}
- 这个程序,一步到位的编译指令是:
gcc hello.c -o test
,实质上,编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 (Compilation)、汇编 (Assembly)和连接(Linking)。
过程详解
1.预处理
gcc -E hello.c -o hello.i
gcc 的-E 选项,可以让编译器在预处理后停止,并输出预处理结果。-o命令生成目标文件,若省略-哦,则会直接在命令行中输出预处理后的代码。hello.i 文件可以作为普通文本文件打开进行查看,其代码片段如下所示:
extern void funlockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__));
# 868 "/usr/include/stdio.h" 3 4
# 2 "hello.c" 2
# 2 "hello.c"
int main(void)
{
printf("hello my superhero!\n");
return 0;
}
2.编译
编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。 使用 gcc 进行编译的命令如下:
gcc -S hello.i -o hello.s
上述命令生成的汇编程序 hello.s 的代码片段如下所示,其全部为汇编代码。
.file "hello.c"
.text
.section .rodata
.LC0:
.string "hello my superhero!"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
leaq .LC0(%rip), %rdi
call puts@PLT
movl $0, %eax
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (Ubuntu 7.5.0-3ubuntu1~18.04) 7.5.0"
.section .note.GNU-stack,"",@progbits
3.汇编
汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标 文件后,才能进入下一步的链接工作。
使用 gcc 进行汇编的命令如下: gcc -c hello.s -o hello.o
注意:hello.o 目标文件为 ELF(Executable and Linkable Format)格式的可重定向文件
4.链接
将程序的目标文件与所需的所有附加的目标文件连接起来,最终生成可执行文件。链接也分为静态链接和动态链接。静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行 文件会比较大。动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。
gcc hello.c -o hello
使用size hello
命令可以查看hello的大小
链接器链接后生成的最终文件为 ELF 格式可执行文件,一个 ELF 可执行文件通常 被链接为不同的段,常见的段譬如.text、.data、.rodata、.bss 等段。
反汇编ELF
由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编如下:objdump -D hello
使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:
gcc -o hello -g hello.c
//要加上-g 选项
objdump -S hello
总结
gcc编译过程可以一步到位,但实际上经过了四个步骤,将程序翻译成机器可识别的二进制编码之后才能执行