文章目录
一、GCC编译器相关软件及用途
1.Binutils
:一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、ldd、readelf、 size 等,这一组工具是开发和调试不可缺少的工具 。
1)addr2line:用来将程序地址转换成其所对应的程序源文件及所对应的代码行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对应的源代码位置。
2)ar:主要用于创建静态库。
3)as:根据汇编指令和处理器指令的对照表一一翻译汇编代码。
3)ldd:用于查看一个可执行程序依赖的共享库。
4)objcopy: 将一种对象文件翻译成另一种格式。
5)size:列出ELF可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小等。
6)objdump:主要的作用是反汇编。
7)readelf: 显示有关ELF 文件的信息。
2.C运行库
C 语言标准仅仅定义了C 标准库函数原型, 并没有提供实现。因此, C 语言编译器通常需要一个C 运行库( C Run Time Libray, CRT) 的支持。
二、编译过程示例
1.hello.c代码
此程序很简单,仅仅打印一个Hello World 的字符串。
#include <stdio.h>
int main(void)
{
printf("Hello World! \n");
return 0;
}
2.编译过程
1)预处理
主要包括以下过程:
(1) 将所有的#define 删除, 并且展开所有的宏定义, 并且处理所有的条件预编译指令, 比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令, 将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“ //” 和“ /* */” 。
(4) 添加行号和文件标识, 以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令, 后续编译过程需要使用它们。
gcc -E hello.c -o hello.i
hello.i代码片段
2)编译
对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。
gcc -S hello.i -o hello.s
hello.s代码片段
3)汇编
调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o的目标文件中。.o
目标文件为 ELF(Executable and Linkable Format)格式的可重定向文件。
gcc -c hello.s -o hello.o
或者
as -c hello.s -o hello.o
hello.o代码片段
4)链接
分为静态链接和动态链接。静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。
gcc hello.c -o hello
使用动态库链接,生成的ELF可执行文件的大小:
使用静态库链接,生成的ELF可执行文件变得极大。
三、ElF文件
1.链接视图
ELF文件格式提供了两种视图,分别是链接视图和执行视图。链接视图是以节(section)为单位,执行视图是以段(segment)为单位。链接视图就是在链接时用到的视图,而执行视图则是在执行时用到的视图。下图左侧的视角是从链接来看的,右侧的视角是执行来看的。
在链接视图下,一个典型的 ELF 文件包含下面几个段:
.text:已编译程序的指令代码段。
.rodata:ro 代表 read only,即只读数据(譬如常数 const)。
.data:已初始化的 C 程序全局变量和静态局部变量。
.bss:未初始化的 C 程序全局变量和静态局部变量。
.debug:调试符号表,调试器用此段的信息帮助调试。
.Program Header Table:程序头部表,如果存在的话,告诉系统如何创建进程映像。
.Section Header Table:节区头部表,包含了描述文件节区的信息,比如大小、偏移等。
输入以下命令,查看各个段的信息:
readelf -S test
2.反汇编ELF
可以通过以下命令对一个ELF文件反汇编,这就可以像查看普通文本文件一样查看ELF文件包含的指令和数据。
objdump -D test
使用以下指令可以将ELF文件反汇编并且将其源代码一同展示。
gcc -o test -g test.c
objdump -S test
四、总结
看似简单的编译,其中包含了预处理、编译、汇编和链接四个过程,。每一个过程都得依赖不同的“伙伴”来完成。通过本次实验,我对gcc编译的过程以及ELF文件的相关知识都有了更深一步的认识,这个过程也极大地激发了我对于汇编语言的兴趣。