Linux GCC常用命令和ELF文件格式

一、Linux GCC 常用命令

1.gcc简介

GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL 语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语 言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另 一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在

2.程序编译

Ⅰ.一步到位的编译

①test.c代码

#include <stdio.h>
int main(void) {
 printf("Hello World!\n");
 return 0; }

②一步到位的编译指令

gcc test.c -o test

事实上编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 (Compilation)、汇编 (Assembly)和连接(Linking),下面从这四个阶段做一个详解

Ⅱ.分布进行

①预处理

对hello.c 的程序进行预编译 .i做扩展名,生成文本文件;
gcc 的-E 选项,可以让编译器在预处理后停止,并输出预处理结果。在本例中,预处理结果就是将 stdio.h 文件中的内容插入到 test.c 中

命令

cc -E test.c -o test.i 
或者
gcc -E test.c

②编译

预处理之后,可直接对生成的 test.i 文件编译,生成汇编代码;
gcc 的-S 选项,表示在程序编译期间,在生成汇编代码后,停止,-o 输出汇编代码文件;
进行编译,生成一个汇编语言源程序文件.s做扩展名,编译后是文本文件

命令

gcc -S test.i -o test.s

③汇编

生成一个可重定位目标文件 . o作扩展名,汇编后是二进制文件

命令

gcc -c test.s -o test.o

④连接

将多个可重定位目标文件和标准库函数,printf所在的可重定位目标模块printf.o进行链接,生成可执行目标文件

命令

gcc test.o -o test

Ⅲ.运行结果

在这里插入图片描述

3.多个程序文件的编译

①程序代码
test1.c

#include<stdio.h>
void f1(){
printf("This is test1.c!\n");
}

test2.c

#include<stdio.h>
void f2(){
printf("This is test2.c!\n");
}

②编译并生成结果
命令

gcc -c test1.c test2.c
或者
gcc -c test1.c -o test1.o 
gcc -c test2.c -o test2.o 

ls命令可以查看有哪些文件
在这里插入图片描述

4.检错

编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助Linux 程序员离这个目标越来越近。或者换句话说,-pedantic 选项能够帮助程序员发现一些不符合ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。
除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。

gcc -Werror test.c -o test

5.库文件连接

开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支
持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、
或 lib、dll)的集合。。虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下,而库文
件则放到/usr/lib/目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib,
以及系统文件夹下。但也有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己
的办法来查找所需要的头文件和库文件。

①代码

#include <stdio.h>
 int main(void) {
  printf("This test6! \n"); 
  return 0; }

②命令

编译
gcc -c test.c 
链接
gcc test.o -o test
运行
./test

③运行结果
在这里插入图片描述

二、不同工具

1.GCC编译工具

GCC(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++语言编写的程序
转换成为处理器能够执行的二进制代码的过程即由编译器完成

2.Binutils

一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、 ldd、readelf、 size 等。这 一组工具是开发和调试不可缺少的工具 。

(1) addr2line:用 来将程序 地址转 换成其所 对应的程 序源文件及所对应的代码行,也可以得到所对应的函数。
(2)as:主要用于汇编,有关汇编的详细介绍请参见后文。 (3) ld:主要用于链接,有关链接的详细介绍请参见后文。
(4)ar:主要用于创建静态库。 (5) ldd:可以用于查看一个可执行程序依赖的共享库。
(6)objcopy:将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或 者将.elf 转换成.bin 等。
(7)objdump:主要的作用是反汇编。 (8) readelf:显示有关 ELF 文件的信息。
(9)size:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小 等

3.C 运行库

C 语言编译 器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又 常简称为 C 运行库

C 语言标准主要由两部分组成: (1)描述 C 的语法, (2)描述 C 标准库。 C
标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类 型声明和宏定义。 C 语言标准仅仅定义了 C
标准库函数原型,并没有提供实现。与 C 语言类似,C++也定义了自己的标准,同时提供相关支 持库,称为 C++运行时库。

三、ELF文件格式——Hello.c示例

1.代码及编译过程

①一段反复出现的代码
hello.c

#include <stdio.h>
 int main(void) {
  printf("Hello World! \n"); 
  return 0; }

②预处理

预处理的过程主要包括以下过程:
(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编 译指令,比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。

命令

gcc -E hello.c -o hello.i

③查看预处理文件
hello.i 文件可以作为普通文本文件打开进行查看
命令

cat hello.i

在这里插入图片描述
④编译
编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及 优化后生成相应的汇编代码。
命令

gcc -S hello.i -o hello.s

可以看到hello.s文件
在这里插入图片描述
⑤汇编
每一个汇编语句几乎都对应一条处理器指令,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理器指令的对照表一一翻译即可

1)汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。
2)当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标 文件后,才能进入下一步的链接工作。
3)目标文件已经是最终程序的某一部 分了,但是在链接之前还不能执行

命令

gcc -c hello.s -o hello.o

⑥链接
分为动态链接和静态链接

静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行 文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链 接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完 成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和 重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。
动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统 中把相应动态库加载到内存中去。
———在 Linux 系 统中,gcc 编 译链 接时 的动 态库 搜索 路径 的 顺序 通常 为:首 先从 gcc 命 令的 参 数-L 指 定的 路径 寻找 ;再 从环 境变 量 LIBRARY_PATH 指 定的 路径 寻址;再 从默 认路 径 /lib、/usr/lib、 /usr/local/lib 寻找 。
——— 在 Linux 系 统中,执 行二 进制 文件 时的 动态 库搜 索路 径的 顺序 通常 为:首 先搜 索编 译目 标 代码 时指 定的 动态 库搜 索路 径;再 从环 境变 量 LD_LIBRARY_PATH 指 定的 路径 寻址;再 从 配置 文件/etc/ld.so.conf 中 指定 的动 态库 搜索 路径 ;再 从默 认路 径/lib、/usr/lib 寻找 。
———在 Linux 系统中,可以 用 ldd 命令查看一个可执程序

命令

动态库命令
gcc hello.c -o hello
size hello //使用 size 查看大小
ldd hello //可以看出该可执行文件链接了很多其他动态库,主要是 Linux 的 glibc 动态库
静态库命令
gcc -static hello.c -o hello
size hello //使用 size 查看大小
ldd hello

运行结果
在这里插入图片描述

2.分析ELF 文件

①ELF 文件的段

一个典型的 ELF 文件包含下面几个段:
.text:已编译程序的指令代码段。
.rodata:ro 代表 read only,即只读数据(譬如常数 const)。
.data:已初始化的 C 程序全局变量和静态局部变量。
.bss:未初始化的 C 程序全局变量和静态局部变量。
.debug:调试符号表,调试器用此段的信息帮助调试。

在这里插入图片描述

使用命令readelf -S 查看其各个 section

readelf -S hello

在这里插入图片描述
②反汇编 ELF
为什么使用反汇编

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包 含的指令和数据,需要使用反汇编的方法

命令

objdump -D hello

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来

gcc -o hello -g hello.c
objdump -S hello

在这里插入图片描述

四、总结

熟练掌握gcc的常用命令,了解c语言程序编译的四个过程,预处理,汇编,编译,链接,了解了执行对应命令后文件格式的变化。了解ELF文件的基本格式内容,对程序执行过程了解更加清晰。对于gcc这种工具的理解有了大幅度提高

参考链接
GCC编译器背后的故事
GCC常用命令

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值