Ubuntu18.04系统下,gcc编译过程分析、命令参数介绍及ELF文件格式学习

GCC编译器背后的故事及常用命令、了解ELF文件格式



前言

在之前的学习过程中,对于一个创建好的test.c文件,当我们用gcc命令进行编译时,都是直接使用的“gcc test.c -o test”命令来一步到位;但其实,一个完整的GCC编译流程包含了:C 源文件创建、预处理、编译、汇编、链接这五个基本步骤。因此,通过本文的学习,你将详细地了解到gcc编译的全过程,以及各大环节对应的命令参数

同时,本文还会进行ELF文件格式的学习


一、GCC简介

  • GCC(GNU C Compiler,GNU C编译器,简称GCC)是在Linux下编写、编译C程序,经常使用的一款编译器。
  • 早期的GCC只支持X86架构、只支持C语言,后来随着不断演进迭代,开始支持越来越多的处理器架构(X86、ARM、PowerPC…),开始支持越来越多的编程语言(C、C++、ADA、Fortran…),GCC的内涵也随之发生了变化,此时不再是GNU C Compiler的简称,而是GNU Compiler Collection(GNU编译器套件)的简称。全套的GCC,不仅可以编译C语言,还可以编译C++语言。不仅可以编译在X86上运行的程序,还可以编译在ARM平台上运行的程序。

二、GCC背后的战友

1.Binutils

Binutils是一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、ldd、readelf、 size 等。这一组工具是开发和调试不可缺少的工具 ,分别简介如下:

工具作用简介
addr2line将程序地址转换成其所对应的程序源文件及所对应的代码行,也可以得到所对应的函数;该工具将帮助调试器在调试的过程中定位对应的源代码位置
as主要用于汇编
ld主要用于链接
ar主要用于创建静态库(静态库与动态库的概念可看鄙人前一篇文章进行学习)
ldd用于查看一个可执行程序依赖的共享库
objcopy将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或者将.elf 转换成.bin 等
objdump主要的作用是反汇编
readelf显示有关 ELF 文件的信息
size列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小等

2.C运行库

  • C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库
  • C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义在 stdio 头文件中。
  • C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支持库,称为 C++运行时库。

三、GCC编译流程及对应命令

1.编译流程图及命令框图

  • 流程图:
    在这里插入图片描述
  • 命令框图:
流程命令参数
准备工作C 源文件创建
预处理gcc -E test.c -o test.i 或gcc -E test.c
编译gcc -S test.i -o test.s
汇编gcc -c test.s -o test.o
链接gcc test.o -o test

2.准备工作

  • 创建一个test.0目录用于存放本次文件

mkdir test0
cd test0

在这里插入图片描述

  • 用vim编辑器生成一个简单hello.c程序文件
    代码如下:
#include<stdio.h>
int main(void)
{
	printf("Hello World!\n");
	return 0;
}

在这里插入图片描述

3.预处理

  • 预处理的过程主要包括以下过程:

(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。

  • gcc进行预处理的命令如下:

gcc -E hello.c -o hello.i

// 将源文件 hello.c 文件预处理生成 hello.i
// GCC 的选项-E 使 GCC 在进行完预处

在这里插入图片描述

4.编译

  • 编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码

  • gcc进行编译的命令如下:

gcc -S hello.i -o hello.s

// 将预处理生成的 hello.i 文件编译生成汇编程序 hello.s
// GCC 的选项-S 使 GCC 在执行完编译后停止,生成汇编程序

在这里插入图片描述

5.汇编

  • 汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o的目标文件中。

  • 由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理器指令的对照表一一翻译即可。

  • 当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标文件后,才能进入下一步的链接工作。

  • 注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。

  • gcc进行汇编的命令如下:

gcc -c hello.s -o hello.o

// 将编译生成的 hello.s 文件汇编生成目标文件 hello.o
// GCC 的选项-c 使 GCC 在执行完汇编后停止,

在这里插入图片描述

6.链接

  • 链接也分为静态链接和动态链接

  • 在 Linux 系统中,gcc 编译链接时的动态库搜索路径的顺序通常为:首先从 gcc 命令的。参数-L 指定的路径寻找;再从环境变量 LIBRARY_PATH 指定的路径寻址;再从默认路径/lib、/usr/lib、/usr/local/lib 寻找

  • 在 Linux系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首先搜索编 译目标代码时指定的动态库搜索路径;再从环境变量 LD_LIBRARY_PATH 指定的路径寻址;再从配置文件/etc/ld.so.conf 中指定的动态库搜索路径;再从默认路径/lib、/usr/lib寻找

  • 在 Linux 系统 中,可以用 ldd 命令查看一个可执行程序依赖的共享库

由于链接动态库和静态库的路径可能有重合,所以如果在路径中有同名的静态库文件和动
态库文件,比如 libtest.a 和 libtest.so,gcc 链接时默认优先选择动态库,会链接
libtest.so,如果要让 gcc 选择链接 libtest.a 则可以指定 gcc 选项-static,该选项会强
制使用静态库进行链接。

  • gcc进行链接的命令如下:

gcc hello.c -o hello
./hello

在这里插入图片描述

四、GCC其他常用命令简介

1.多个程序文件的编译

  • 假设有一个由 test1.c 和 test2.c 两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序 test,可以使用下面这条命令:

gcc test1.c test2.c -o test

  • 如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下三条命令:

gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test

2.检错

  • -pedantic 选项能够帮助程序员发现一些不符合ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。

gcc -pedantic illcode.c -o illcode

  • 除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。

gcc -Wall illcode.c -o illcode

  • 一个优秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror 选项,那么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:

gcc -Werror test.c -o test

3.库文件连接

函数库实际上就是一些头文件(.h)和库文件(so、或 lib、dll)的集合;

虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib,以及系统文件夹下。但有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己的办法来查找所需要的头文件和库文件;

例如:我们的程序 test.c 是在 linux 上使用 c 连接 mysql,这个时候我们需要去 mysql 官网下载 MySQL Connectors 的 C 库,下载下来解压之后,有一个 include 文件夹,里面包含mysql connectors 的头文件,还有一个 lib 文件夹,里面包含二进制 so 文件 libmysqlclient.so,其中 inclulde 文件夹的路径是/usr/dev/mysql/include,lib 文件夹是/usr/dev/mysql/lib

3.1 编译成可执行文件

  • 首先要进行编译 test.c 为目标文件:

gcc –c –I /usr/dev/mysql/include test.c –o test.o

3.2 链接

  • 把所有目标文件链接成可执行文件:

gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test

注:Linux 下的库文件分为两大类分别是动态链接库(通常以.so 结尾)和静态链接库(通常以.a 结尾),二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的)

3.3 强制链接时使用静态链接库

  • 默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库,如果需要的话可以在编译时加上-static 选项,强制使用静态链接库
  • 在/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.solibmysqlclient.a
  • 为了让GCC 在链接时只用到静态链接库,可以使用下面的命令:

gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test

  • 静态库链接时搜索路径顺序:
    ld 会去找 GCC 命令中的参数-L ,
    再找 gcc 的环境变量 LIBRARY_PATH ,
    再找内定目录/lib /usr/lib /usr/local/lib

  • 动态链接时、执行时搜索路径顺序:
    编译目标代码时指定的动态库搜索路径,
    环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径,
    配置文件/etc/ld.so.conf 中指定的动态库搜索路径,
    默认的动态库搜索路径/lib,
    默认的动态库搜索路径/usr/lib

  • 有关环境变量:
    LIBRARY_PATH 环境变量:指定程序静态链接库文件搜索路径
    LD_LIBRARY_PATH 环境变量:指定程序动态链接库文件搜索路径

五、ELF文件学习

  • 目标文件再不同的系统或平台上具有不同的命名格式,在Unix和X86-64 Linux上称为ELF(Executable and Linkable Format, ELF)
  • ELF文件格式提供了两种不同的视角,在汇编器和链接器看来,ELF文件是由Section Header Table描述的一系列Section的集合,而执行一个ELF文件时,在加载器(Loader)看来它是由Program Header Table描述的一系列Segment的集合
  • ELF是一类文件类型,而不是特指某一后缀的文件。ELF文件格式,在Linux下主要有如下三种文件:
    可执行文件(.out)
    可重定位文件(.o文件)
    共享目标文件(.so)

1.ELF文件的段

  • 如图所示,位于 ELF Header 和 Section Header Table 之间的都
    是段(Section)
    在这里插入图片描述
  • 一个典型的 ELF 文件包含下面几个段:

.text:已编译程序的指令代码段
.rodata:ro 代表 read only,即只读数据(譬如常数 const)
.data:已初始化的 C 程序全局变量和静态局部变量
.bss:未初始化的 C 程序全局变量和静态局部变量
.debug:调试符号表,调试器用此段的信息帮助调试

  • 使用readelf -S可查看其各个section的信息:

readelf -S hello

在这里插入图片描述

2.反汇编ELF

  • 由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法
  • 使用 objdump -D 对其进行反汇编:

objdump -D hello

在这里插入图片描述

  • 使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:

gcc -o hello -g hello.c
objdump -S hello

在这里插入图片描述

总结

通过本篇文章的学习,希望能够帮助大家进一步学习和了解在Ubuntu18.04系统下,gcc编译的详细过程分析、gcc常用命令参数等等,以及对于ELF文件格式的初步了解与学习。同时也期待大家能够积极留言,指出我存在的问题,谢谢!

参考文献:
https://blog.csdn.net/qq_46467126/article/details/120625400?spm=1001.2014.3001.5502
https://www.w3cschool.cn/article/c692b4047e2a70.html
https://www.zhaixue.cc/gcc/gcc-compile.html

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值