Linux里gcc编译过程分析和ELF文件格式学习

GCC编译器背后的故事及常用命令、了解ELF文件格式
前言
一、GCC简介
二、GCC背后的战友
1.Binutils
2.C运行库
三、GCC编译流程及对应命令
1.编译流程图及命令框图
2.实践操作
3.预处理
4.编译
5.汇编
6.链接
四、ELF文件学习
1.ELF文件的段
2.反汇编ELF
总结

一、GCC简介

GCC(GNU C Compiler,GNU C编译器,简称GCC)是在Linux下编写、编译C程序,经常使用的一款编译器。GCC C编译器的原作者是大胡子Richard Stallman,也是GNU项目的奠基人。GNU项目是一个非盈利项目,用来打造一个类似Unix的开源自由的操作系统,一般每个操作系统都有配套的编译器,用来编译能在这个操作系统上运行的应用程序,GNU也不例外,也需要一个配套的编译器,GCC就是大胡子把自己关在小铁屋里,白手起家,一行一行代码敲起来的,用来编译可以在GNU操作系统上运行的C语言程序。

二、GCC背后的战友

1.Binutils
Binutils是一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、ldd、readelf、 size 等。这一组工具是开发和调试不可缺少的工具 ,分别简介如下:

工具    作用简介
addr2line    将程序地址转换成其所对应的程序源文件及所对应的代码行,也可以得到所对应的函数;该工具将帮助调试器在调试的过程中定位对应的源代码位置
as    主要用于汇编
ld    主要用于链接
ar    主要用于创建静态库(静态库与动态库的概念可看鄙人前一篇文章进行学习)
ldd    用于查看一个可执行程序依赖的共享库
objcopy    将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或者将.elf 转换成.bin 等
objdump    主要的作用是反汇编
readelf    显示有关 ELF 文件的信息
size    列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小等
2.C运行库
C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库
C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义在 stdio 头文件中。
C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支持库,称为 C++运行时库。
 

三、GCC编译流程及对应命令

1.编译流程图及命令框图

以hello.c为例:从一个C语言源文件,到生成最后的可执行文件,GCC编译过程的基本流程如下:

  • C 源文件: 编写一个简单的hello world程序
  • 预处理:生成预处理后的C源文件 hello.i
  • 编译:将C源文件翻译成汇编文件 hello.s
  • 汇编:将汇编文件汇编成目标文件 hello.o
  • 链接:将目标文件链接成可执行文件

gcc命令是GCC编译器里的一个前端程序,用来控制整个编译过程:分别调用预处理器、编译器和汇编器,完成编译的每一个过程,最后调用链接器,生成可执行文件:a.out

默认情况下,gcc命令会自动完成上述的整个编译过程。当然,gcc还提供了一系列参数,使用这个参数,可以让用户精准控制每一个编译过程。

  • -E :只做预处理,不编译
  • -S :只编译,将C程序编译为汇编文件
  • -c :只汇编,不链接。
  • -o :指定输出的文件名

2.实际操作

  • 用nano编辑器生成一个简单hello.c程序文件
    代码如下:
#include<stdio.h>
int main(void)
{
	printf("Hello World!\n");
	return 0;
}

 

3.预处理

(1)将所有的#define删除,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等。

(2)处理#include预编译指令,将被包含的文件插入到该预编译指令的位置。

(3)删除所有注释“//”和“/**/”。

(4)添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。(5)保留所有的#pragma 编译器指令,后续编译过程需要使用它们。

使用gcc进行预处理的命令如下:gcc -E hello.c -o hello.i

//将源文件hello.c文件预处理生成hello.il/ / GCC的选项-E使GCC在进行完预处理后即停止

hello.i文件可以作为普通文本文件打开进行查看,其代码片段如下所示:

4.编译

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。
使用gcc进行编译的命令如下:
 

gcc -S hello.i -o hello.s

 //将预处理生成的hello.i文件编译生成汇编程序hello.sl

// GCC的选项-S 使GCC在执行完编译后停止,生成汇编程序上述命令生成的汇编程序hello.s 的代码片段如下所示,其全部为汇编代码。

5.汇编

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o的目标文件中。

由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理器指令的对照表一一翻译即可。

当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标文件后,才能进入下一步的链接工作。

注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。

gcc进行汇编的命令如下:

gcc -c hello.s -o hello.

 

6.链接

链接也分为静态链接和动态链接

在 Linux 系统中,gcc 编译链接时的动态库搜索路径的顺序通常为:首先从 gcc 命令的。参数-L 指定的路径寻找;再从环境变量 LIBRARY_PATH 指定的路径寻址;再从默认路径/lib、/usr/lib、/usr/local/lib 寻找

在 Linux系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首先搜索编 译目标代码时指定的动态库搜索路径;再从环境变量 LD_LIBRARY_PATH 指定的路径寻址;再从配置文件/etc/ld.so.conf 中指定的动态库搜索路径;再从默认路径/lib、/usr/lib寻找

由于链接动态库和静态库的路径可能有重合,所以如果在路径中有同名的静态库文件和动态库文件,比如 libtest.a和 libtest.so,gcc链接时默认优先选择动态库,会链接libtest.so,如果要让gcc选择链接libtest.a则可以指定gcc选项-static,该选项会强制使用静态库进行链接。以Hello World为例:
如果使用命令“gcc hello.c -o hello”则会使用动态库进行链接,生成的ELF可执行文件的大小(使用Binutils 的 size命令查看)和链接的动态库(使用Binutils 的 ldd命令查看)如下所示:

gcc进行链接的命令如下:

gcc hello.c -o hello

size hello//使用size查看大小

ldd hello //可以看出该可执行文件链接了很多其他动态库,主要是Linux的 glibc动态库

 

 

 

 

四、ELF文件学习

目标文件再不同的系统或平台上具有不同的命名格式,在Unix和X86-64 Linux上称为ELF(Executable and Linkable Format, ELF)
ELF文件格式提供了两种不同的视角,在汇编器和链接器看来,ELF文件是由Section Header Table描述的一系列Section的集合,而执行一个ELF文件时,在加载器(Loader)看来它是由Program Header Table描述的一系列Segment的集合
ELF是一类文件类型,而不是特指某一后缀的文件。ELF文件格式,在Linux下主要有如下三种文件:
可执行文件(.out)
可重定位文件(.o文件)
共享目标文件(.so)

1.ELF文件的段

 ELF文件格式如下图所示,位于ELF Header 和 Section Header Table之间的都是段( Section) 。一个典型的ELF文件包含下面几个段:

.text:已编译程序的指令代码段。

.rodata: ro代表read only,即只读数据(譬如常数const ) 。. data:已初始化的C程序全局变量和静态局部变量。

.bss :未初始化的C程序全局变量和静态局部变量。.debug:调试符号表,调试器用此段的信息帮助调试。

可以使用readelf -S查看其各个section的信息如下:

readelf -S hello

 

 

2.反汇编ELF

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法

使用 objdump -D 对其进行反汇编:

objdump -D hello

 

 

 

 

 

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:

gcc -o hello -g hello.c
objdump -S hello

 

总结

 通过本篇文章的学习,希望能够帮助大家进一步学习和了解在Ubuntu18.04系统下,gcc编译的详细过程分析、gcc常用命令参数等等,以及对于ELF文件格式的初步了解与学习。同时也期待大家能够积极留言,指出我存在的问题,谢谢!

参考文献:https://blog.csdn.net/qq_53112972/article/details/126922592

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值