情绪反复的一天,原以为自己今天不会学习了,没想到我还是如约来了。给自己点赞,战胜那个糟糕的自己的第一步就是不乱想&行动起来。
今天重新梳理下编译的过程,平常编译的时候直接敲别人写好的命令,虚的很,后面慢慢补上,比如cmake,比如extension等。
CPP编译的完整过程如下:
Cpp源程序 (.h,.cpp)–> 预编译处理 --> 编译优化 --> 汇编程序 --> 链接程序 --> 可执行文件
因此,从原始的CPP文件到最终的可执行文件,经历了4个步骤:预处理、编译、汇编、链接。
对应每个步骤,详解如下:
-
预处理
(1)、将所有的注释以空格代替; (2)、将所有的#define删除,并且展开所有的宏定义; (3)、处理条件编译指令#if,#ifdef、#elif,#else、#endif; (4)、处理#include,展开文件包含; (5)、保留编译器需要使用的#pragma指令 预处理指令示例: gcc -E *.c -o *.i
-
编译优化
(1)、对预处理生成的文件进行语法分析、词法分析、语义分析 语法分析:分析表达式是否遵循语法规则 词法分析:分析关键字,标识符,立即数是否合法 语义分析:在语法分析基础上进一步分析表达式是否合法 (2)、分析结束后进行【代码优化】生成相应的汇编代码文件 编译指令示例: gcc -S *.i -o *.s
-
汇编
(1)、汇编过程是用汇编器将汇编代码转变为机器可以执行的指令,也就是机器指令,也称为目标文件(.o)。 (2)、每条汇编指令几乎都对应一条机器指令 汇编指令示例: gcc - c *.s -o *.o
附:
-E
只激活预处理,这个不生成文件,需要把它重定向到一个输出文件里.
例子:
gcc -E hello.c > pianoapan.txt
gcc -E hello.c | more
一个hello word 也要与处理成800行的代码
-S
只激活预处理和编译,就是指把文件编译成为汇编代码。
例子:
gcc -S hello.c
他将生成.s的汇编代码,你可以用文本编辑器察看
-c
只激活预处理,编译,和汇编,也就是他只把程序做成obj文件
例子:
gcc -c hello.c
他将生成.o的obj文件
-
链接
链接是指将目标文件最终生成可执行文件。
一般在这个阶段,我们会提到动态库和静态库,本质上来说库也是一种可执行文件的二进制形式,可以被操作系统载入内存执行。
根据链接方式的不同,链接过程可以分为:
1、静态链接(.a、.lib):目标文件直接加入到可执行文件 2、动态链接(.so、.dll):在程序启动后才动态加载目标文件
下面重点梳理静态和动态库。
静态库
(来自链接1.)
之所以称为【静态库】,是因为在链接阶段,会将汇编生成的目标文件.o与引用到的库一起链接打包到可执行文件中。
因此对应的链接方式称为静态链接。
试想一下,静态库与汇编生成的目标文件一起链接为可执行文件,那么静态库必定跟.o文件格式相似。
其实一个静态库可以简单看成是一组目标文件(.o/.obj文件)的集合,即很多目标文件经过压缩打包后形成的一个文件。
静态库特点总结:
- 静态库对函数库的链接是放在编译时期完成的。
- 程序在运行时与函数库再无瓜葛,移植方便。
- 浪费空间和资源,因为所有相关的目标文件与牵涉到的函数库被链接合成一个可执行文件。
举例说明:
编写一些简单的四则运算C++类,将其编译成静态库给他人用,头文件如下所示:
//StaticMath.h头文件
#pragma once
class StaticMath
{
public:
StaticMath(void);
~StaticMath(void);
static double add(double a, double b);//加法
static double sub(double a, double b);//减法
static double mul(double a, double b);//乘法
static double div(double a, double b);//除法
void print();
};
Linux下使用ar工具、Windows下vs使用lib.exe,将目标文件压缩到一起,并且对其进行编号和索引,以便于查找和检索。一般创建静态库的步骤如图所示:
图:创建静态库过程
Linux下创建与使用静态库
Linux静态库命名规则
Linux静态库命名规范,必须是:lib[library_name].a
lib为前缀,中间是静态库名,扩展名为.a。
创建静态库(.a)
通过上面的流程可以知道,Linux创建静态库过程如下:
- 首先,将代码文件编译成目标文件.o(StaticMath.o)
g++ -c StaticMath.cpp
//注意带参数-c,否则直接编译为可执行文件
- 然后,通过ar工具将目标文件打包成.a静态库文件
ar -crv libstaticmath.a StaticMath.o
//生成静态库libstaticmath.a。
大一点的项目会编写makefile文件(CMake等等工程管理工具)来生成静态库,以便减轻输入多个命令的麻烦。
使用静态库
编写使用上面创建的静态库的测试代码:
测试代码:
#include "StaticMath.h"
#include <iostream>
using namespace std;
int main(int argc, char* argv[])
{
double a = 10;
double b = 2;
cout << "a + b = " << StaticMath::add(a, b) << endl;
cout << "a - b = " << StaticMath::sub(a, b) << endl;
cout << "a * b = " << StaticMath::mul(a, b) << endl;
cout << "a / b = " << StaticMath::div(a, b) << endl;
StaticMath sm;
sm.print();
system("pause");
return 0;
}
Linux下使用静态库,只需要在编译的时候,指定静态库的搜索路径(-L选项)、指定静态库名(-l选项, 不需要lib前缀和.a后缀,)。
g++ TestStaticLibrary.cpp -L../StaticLibrary -lstaticmath
下图为使用静态库和测试代码一起编译后得到的可执行文件执行结果:
- -L:表示要连接的库所在目录
- -l:指定链接时需要的动态库,编译器查找动态连接库时有隐含的命名规则,即在给出的名字前面加上lib,后面加上.a或.so来确定库的名称。
Windows下创建与使用静态库
见:https://www.cnblogs.com/skynet/p/3372855.html
动态库
为什么还需要动态库?
为什么需要动态库,其实也是静态库的特点导致。
空间浪费是静态库的一个问题。
- 另一个问题是静态库对程序的更新、部署和发布页会带来麻烦。如果静态库liba.lib更新了,所以使用它的应用程序都需要重新编译、发布给用户(对于玩家来说,可能是一个很小的改动,却导致整个程序重新下载,全量更新)。
动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入。不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例,规避了空间浪费问题。动态库在程序运行是才被载入,也解决了静态库对程序的更新、部署和发布页会带来麻烦。用户只需要更新动态库即可,增量更新。
动态库特点总结:
- 动态库把对一些库函数的链接载入推迟到程序运行的时期。
- 可以实现进程之间的资源共享。(因此动态库也称为共享库)
- 将一些程序升级变得简单。
- 甚至可以真正做到链接载入完全由程序员在程序代码中控制(显示调用)
Window与Linux执行文件格式不同,在创建动态库的时候有一些差异。
- 在Windows系统下的执行文件格式是PE格式,动态库需要一个DllMain函数做出初始化的入口,通常在导出函数的声明时需要有_declspec(dllexport)关键字。
- Linux下gcc编译的执行文件默认是ELF格式,不需要初始化入口,亦不需要函数做特别的声明,编写比较方便。
与创建静态库不同的是,不需要打包工具(ar、lib.exe),直接使用编译器即可创建动态库。
Linux下创建与使用动态库
linux动态库的命名规则
动态链接库的名字形式为 libxxx.so,前缀是lib,后缀名为“.so”。
- 针对于实际库文件,每个共享库都有个特殊的名字“soname”。在程序启动后,程序通过这个名字来告诉动态加载器该载入哪个共享库。
- 在文件系统中,soname仅是一个链接到实际动态库的链接。对于动态库而言,每个库实际上都有另一个名字给编译器来用。它是一个指向实际库镜像文件的链接文件(lib+soname+.so)。
创建动态库(.so)
编写四则运算动态库代码:
// DynamicMath.h头文件
#pragma once
class DynamicMath
{
public:
DynamicMath(void);
~DynamicMath(void);
static double add(double a, double b);//加
static double sub(double a, double b);//减
static double mul(double a, double b);//乘
static double div(double a, double b);//除
void print();
};
- 首先,生成目标文件,此时要加编译器选项-fpic
g++ -fPIC -c DynamicMath.cpp
- -fPIC 创建与地址无关的编译程序(pic,position independent code),是为了能够在多个应用程序间共享。
- 然后,生成动态库,此时要加链接器选项-shared
g++ -shared -o libdynmath.so DynamicMath.o
- -shared指定生成动态链接库。
上面两个步骤可以合并为一个命令: g++ -fPIC -shared -o libdynmath.so DynamicMath.cpp
使用动态库
#include "../DynamicLibrary/DynamicMath.h"
#include <iostream>
using namespace std;
int main(int argc, char* argv[])
{
double a = 10;
double b = 2;
cout << "a + b = " << DynamicMath::add(a, b) << endl;
cout << "a - b = " << DynamicMath::sub(a, b) << endl;
cout << "a * b = " << DynamicMath::mul(a, b) << endl;
cout << "a / b = " << DynamicMath::div(a, b) << endl;
DynamicMath dyn;
dyn.print();
return 0;
}
引用动态库编译成可执行文件(跟静态库方式一样):
g++ TestDynamicLibrary.cpp -L../DynamicLibrary -ldynmath
然后运行:./a.out,发现竟然报错了!!!
可能大家会猜测,是因为动态库跟测试程序不是一个目录,那我们验证下是否如此:
发现还是报错!!!那么,在执行的时候是如何定位共享库文件的呢?
-
当系统加载可执行代码时候,能够知道其所依赖的库的名字,但是还需要知道绝对路径。此时就需要系统动态载入器(dynamic linker/loader)。
-
对于elf格式的可执行程序,是由ld-linux.so*来完成的,它先后搜索elf文件的 DT_RPATH段—环境变量LD_LIBRARY_PATH—/etc/ld.so.cache文件列表—/lib/,/usr/lib 目录找到库文件后将其载入内存。
如何让系统能够找到它:
- 如果安装在/lib或者/usr/lib下,那么ld默认能够找到,无需其他操作。
- 如果安装在其他目录,需要将其添加到/etc/ld.so.cache文件中,步骤如下:
- 编辑/etc/ld.so.conf文件,加入库文件所在目录的路径
- 运行ldconfig ,该命令会重建/etc/ld.so.cache文件
我们将创建的动态库复制到/usr/lib下面,然后运行测试程序。
Windows下创建与使用动态库
参考:https://www.cnblogs.com/skynet/p/3372855.html
.so 文件和.out文件的区别
目前我们在编译完成后,一般会见到两大类文件,.out文件和库文件,这里拿.so 动态库文件举例,说说.so 文件和.out文件的区别和联系:
- .so和.out里面应该都是二进制的执行指令。但文件格式,即里面的内容布局是不同的,这个可以在网上找到资料的(?,待补充)。
- .so是二进制格式的链接库文件,包含链接库源文件(.c)中的各函数实现、调试信息等。.so文件最主要的是每个函数的声明和实现代码。
- .out一般也是由gcc编译生成的二进制格式文件,可能包含了库文件。.out文件一般都会分成数据段,代码段,堆栈段的。然后就是一条接一条的指令执行。
- .out和.so文件的区别还在于,.out文件中存在main函数入口,从main函数进入调用各种函数,而.so只是各.o文件的集合,不存在main函数。
附件:Linux下库相关命令
g++(gcc)编译选项
- -shared :指定生成动态链接库。
- -static :指定生成静态链接库。
- -fPIC :表示编译为位置独立的代码,用于编译共享库。目标文件需要创建成位置无关码, 念上就是在可执行程序装载它们的时候,它们可以放在可执行程序的内存里的任何地方。
- -L. :表示要连接的库所在的目录。
- -l:指定链接时需要的动态库。编译器查找动态连接库时有隐含的命名规则,即在给出的名字前面加上lib,后面加上.a/.so来确定库的名称。
- -Wall :生成所有警告信息。
- -ggdb :此选项将尽可能的生成gdb 的可以使用的调试信息。
- -g :编译器在编译的时候产生调试信息。
- -c :只激活预处理、编译和汇编,也就是把程序做成目标文件(.o文件) 。
- -Wl,options :把参数(options)传递给链接器ld 。如果options 中间有逗号,就将options分成多个选项,然后传递给链接程序。
nm命令
有时候可能需要查看一个库中到底有哪些函数,nm命令可以打印出库中的涉及到的所有符号。库既可以是静态的也可以是动态的。nm列出的符号有很多,常见的有三种:
- 一种是在库中被调用,但并没有在库中定义(表明需要其他库支持),用U表示;
- 一种是库中定义的函数,用T表示,这是最常见的;
- 一种是所谓的弱态”符号,它们虽然在库中被定义,但是可能被其他库中的同名符号覆盖,用W表示。
$nm libhello.h
ldd命令
ldd命令可以查看一个可执行程序依赖的共享库,例如我们编写的四则运算动态库依赖下面这些库:
于2021.0219,23:52。
参考:https://www.cnblogs.com/lidan/archive/2011/05/25/2239517.html
https://blog.csdn.net/weixin_38278334/article/details/96987875
https://www.cnblogs.com/skynet/p/3372855.html
https://blog.csdn.net/liuchunjie11/article/details/80252811