【嵌入式开发系统03】gcc编译过程分析、命令参数介绍及ELF文件格式学习

本文目的是主要介绍进一步学习和了解在Ubuntu18.04系统下,gcc编译的详细过程分析、gcc常用命令参数等等,以及对于ELF文件格式的初步了解与学习。


(一)GCC的定义

1.什么是GCC?

● GCC 的意思也只是 GNU C Compiler 而已。
● 经过了这么多年的发展,GCC 已经不仅仅能支持 C语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。
● 另一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。


(二)GCC的战友

1.Binutils

● 一组二进制程序处理工具,包括:addr2linearobjcopyobjdumpasld
lddreadelfsize 等。这 一组工具 是开发和 调试不可 缺少的工具 ,分别简介
如下:
(1) addr2line:用来将程序地址转换成其所对应的程序源文件及所对应的代码
行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对
应的源代码位置。
(2) as:主要用于汇编,有关汇编的详细介绍请参见后文。
(3) ld:主要用于链接,有关链接的详细介绍请参见后文。
(4) ar:主要用于创建静态库。为了便于初学者理解,在此介绍动态库与静态库
的概念:
● 如果要将多个 .o 目标文件生成一个库文件, 则存在两种类型的库,一种是静态库,另一种是动态库。
● 在 windows中静态库是 以 .lib 为后缀的文件,共享库是以 .dll 为后缀的文件。 在 linux 中静态库是以.a 为后缀的文件,共享库是以 .so 为后缀的文件。
● 静态库和动态库的不同点在于代码被载入的时刻不同 。静态库的代码在编译过程中已经被载入可执行程序,因此体积较大 。共享库的代码是在可执行程序运行时才载入内存的,在编译过程中仅简单的引用,因此代码体积较小。在Linux系统中,可以用 ldd 命令查看一个可执行程序依赖的共享库。
● 如果一个系统中存在多个需要同时运行的程序且这些程序之间存在共享库,那么采用动态库的形式将更节省内存。
(5) ldd:可以用于查看一个可执行程序依赖的共享库。
(6) objcopy:将一种对象文件翻译成另一种格式,譬如将.bin转换成.elf、或
者将.elf 转换成.bin 等。
(7) objdump:主要的作用是反汇编。有关反汇编的详细介绍,请参见后文。
(8) readelf:显示有关 ELF 文件的信息,请参见后文了解更多信息。
(9) size:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小
等,请参见后文了解使用size

2.C运行库

● C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库。
● C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义在 stdio 头文件中。
● C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译器通常需要一个 C 运行时(C Run Time Libray,CRT)的支持。C 运行时库又常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支持库,称为 C++运行时库。


(三)GCC编译流程及对应命令

1.编译流程图及命令步骤

● 使用gcc -v命令可以查看当前系统的GCC编译器版本:
在这里插入图片描述
● 编译过程就是把预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后生成相应的汇编代码文件,这个过程是整个程序构建的核心部分,也是最复杂的部分之一。
● 编译过程一般分为 6 个步骤:扫描、语法分析、语义分析、源代码优化、代码生成和目标代码优化,过程如下图:
在这里插入图片描述
●命令流程表:

命令步骤相应代码
创建文件vim .c文件
预处理gcc -E test.c -o test.i 或 gcc -E test.c
生成汇编代码gcc -S test.i
汇编gcc -c test.s
连接gcc -c test.s -o test.o
执行./test

2.准备工作

● 由于 GCC 工具链主要是在 Linux 环境中进行使用,因此本文也将以 Linux 系统作为工作环境。为了能够演示编译的整个过程,先创建一个工作目录 test0,然后用文本编辑器生成一个 C 语言编写的简单 test.c 程序为示例。
● 其源代码如下所示:

mkdir test0
cd test0

在这里插入图片描述

用vim编辑器生成一个test.c程序文件,代码如下:

//test.c
#include<stdio.h>
int main(void)
{
	printf("Hello World!\n");
	return 0;
}

在这里插入图片描述

3.预处理

预处理的过程:

顺序具体步骤
首先将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif 等
其次处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
然后删除所有注释“//”和“/* */”。
再次添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
最后保留所有的#pragma 编译器指令,后续编译过程需要使用它们。

●gcc 的-E 选项,可以让编译器在预处理后停止,并输出预处理结果。在本例中,预处理结果就是将
stdio.h 文件中的内容插入到 test.c 中了。
● gcc进行预处理的命令如下:

gcc -E test.c -o test.i

在这里插入图片描述

● 将源文件 test.c 文件预处理生成 test.i。

4.编译

● 预处理之后,可直接对生成的 test.i 文件编译,生成汇编代码。
● gcc进行编译的命令如下:

gcc -S test.i -o test.s

在这里插入图片描述

● 将预处理生成的 test.i 文件编译生成汇编程序 test.s
● gcc 的-S 选项,表示在程序编译期间,在生成汇编代码后,停止,-o 输出汇编代码文件

5.汇编

● 汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o的目标文件中。
● 由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理器指令的对照表一一翻译即可。
● 当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标文件后,才能进入下一步的链接工作。
● 注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。

● gcc进行汇编的命令如下:

gcc -c test.s -o test.o

在这里插入图片描述
● 将编译生成的 test.s 文件汇编生成目标文件 test.o。

6.链接

● gcc 连接器是 gas 提供的,负责将程序的目标文件与所需的所有附加的目标文件连接起来,最终生
成可执行文件。附加的目标文件包括静态连接库和动态连接库。

链接
静态链接静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。
动态链接动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。

● 在 Linux 系统中,gcc 编译链接时的动态库搜索路径的顺序通常为:首先从 gcc 命令的。参数-L 指定的路径寻找;再从环境变量 LIBRARY_PATH 指定的路径寻址;再从默认路径/lib、/usr/lib、/usr/local/lib 寻找
● 在 Linux系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首先搜索编 译目标代码时指定的动态库搜索路径;再从环境变量 LD_LIBRARY_PATH 指定的路径寻址;再从配置文件/etc/ld.so.conf 中指定的动态库搜索路径;再从默认路径/lib、/usr/lib寻找
● 在 Linux 系统 中,可以用 ldd 命令查看一个可执行程序依赖的共享库
● 对于上一小节中生成的 test.o,将其与C标准输入输出库进行连接,最终生成程序 test。
gcc进行链接的命令如下:

gcc test.c -o test
./test

在这里插入图片描述


(四) 多个程序文件的编译

● 通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用 GCC 能够很好地管理这些编译单元。假设有一个由 test1.c 和 test2.c 两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序 test,可以使用下面这条命令:

gcc test1.c test2.c -o test

● 如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下三条命令:

gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test


(五)检错

-pedantic 选项能够帮助程序员发现一些不符合ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。

gcc -pedantic illcode.c -o illcode

● 除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。

gcc -Wall illcode.c -o illcode

● 一个优秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror 选项,那么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:

gcc -Werror test.c -o test


(六)库文件连接

● 开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、或 lib、dll)的集合。
● 虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib,以及系统文件夹下。
但有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己的办法来查找所需要的头文件和库文件。
● 例如:我们的程序 test.c 是在 linux 上使用 c 连接 mysql,这个时候我们需要去 mysql 官网下载 MySQL Connectors 的 C 库,下载下来解压之后,有一个 include 文件夹,里面包含mysql connectors 的头文件,还有一个 lib 文件夹,里面包含二进制 so 文件 libmysqlclient.so,其中 inclulde 文件夹的路径是/usr/dev/mysql/include,lib 文件夹是/usr/dev/mysql/lib
● 其中 inclulde 文件夹的路径是/usr/dev/mysql/include,lib 文件夹是/usr/dev/mysql/lib。

1.编译成可执行文件

● 首先要进行编译 test.c 为目标文件:

gcc –c –I /usr/dev/mysql/include test.c –o test.o

2.链接

● 把所有目标文件链接成可执行文件:

gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test

● Linux 下的库文件分为两大类分别是动态链接库(通常以.so 结尾)和静态链接库(通常以.a 结尾),二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。

3.强制链接时使用静态链接库

● 默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库,如果需要的话可以在编译时加上-static 选项,强制使用静态链接库。
● 在/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.so 和 libmysqlclient.a,为了让GCC 在链接时只用到静态链接库,可以使用下面的命令:

gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test

● 静态库链接时搜索路径顺序:

⭐ld 会去找 GCC 命令中的参数-L。
⭐再找 gcc 的环境变量 LIBRARY_PATH。
⭐再找内定目录/lib /usr/lib/usr/local/lib

● 动态链接时、执行时搜索路径顺序:

⭐编译目标代码时指定的动态库搜索路径。
⭐环境变量 LD_LIBRARY_PATH 指定的动态库搜索路径。
⭐配置文件/etc/ld.so.conf 中指定的动态库搜索路径。
⭐默认的动态库搜索路径/lib。
⭐默认的动态库搜索路径/usr/lib

● 有关环境变量:

⭐LIBRARY_PATH 环境变量:指定程序静态链接库文件搜索路径
⭐ LD_LIBRARY_PATH 环境变量:指定程序动态链接库文件搜索路径


(七)ELF文件学习

1.ELF的定义

● ELF是一种文件格式,用于存储Linux程序。大概包括编制好的计算机指令,数据,计算机在需要的时候把这个文件读取到内存中,cpu就可以从内存中一条一条的读取指令来执行了。

创建过程运行进程
用户请求运行程序时操作系统会读取存储在磁盘上的可执行文件,在linux系统上这个文件就是我们的elf格式文件,为用户分配4G的虚拟内存空间
根据文件的信息指示把不同的文件内容放到为你分配的这3G虚拟内存
然后根据文件的指示系统设置设置代码段和数据段寄存器
再根据文件的指示跳转到用户的代码的入口地址(一般就是我们的main函数)
从main开始计算机就一条一条的执行我们给的指令,处理我们的数据了,直到我们程序结束。虽然在这个过程中,系统会多次切换到其他进程,但对用户程序来说没有影响,我们可以认为计算机只为我们服务

● ELF文件三种类型:

⭐目标文件(通常是.o)
⭐ 可执行文件(.out)
⭐共享目标文件(.so)

2.ELF文件的段

● ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都
是段(Section)。一个典型的 ELF 文件包含下面几个段:

⭐text:已编译程序的指令代码段
⭐rodata:ro 代表 read only,即只读数据(譬如常数 const)
⭐data:已初始化的 C 程序全局变量和静态局部变量
⭐bss:未初始化的 C 程序全局变量和静态局部变量
⭐debug:调试符号表,调试器用此段的信息帮助调试

在这里插入图片描述

● 使用readelf -S可查看其各个section的信息:

readelf -S hello

在这里插入图片描述

3.反汇编ELF

● 由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编:
objdump -D hello
在这里插入图片描述
● 使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:

gcc -o hello -g hello.c
objdump -S hello

在这里插入图片描述


(八)总结

本文目的是主要介绍GCC编译过程中的常用命令及工具,gcc编译的详细过程分析、gcc常用命令参数等等,清楚了解ELF文件格式与学习,使用的时候如何选择,以及操作实例的示范。
寄语:你很累了吗
   外面的世界让你沉默,让你不知如何表诉。
   那就回家吧,你只需要好好洗漱一下,躺在床上,盖好厚被子,睡一觉,一切就好了。

参考文献:
https://blog.csdn.net/qq_46467126/article/details/120625400?spm=1001.2014.3001.5502
https://www.zhaixue.cc/gcc/gcc-install.html
https://blog.csdn.net/chdhust/article/details/9040647

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值