目录
3.2.1 main.i经过前端生成main.bc供中端优化
编辑3.2.2 中端优化main.bc生成main.opt.bc(架构无关)
3.2.3 后端将main.opt.bc转化成汇编文件main.s(架构相关)
一、传统编译器编译流程
缺点:前端和后端没有完全分离,耦合在了一起,因而如果要支持一门新的语言或硬件平台,需要做大量的工作。
二、LLVM编译器架构
优点:解耦合,不同的前端后端使用统一的中间代码LLVM Intermediate Representation (LLVM IR)。
- 如果需要支持一种新的编程语言,那么只需要实现一个新的前端。
- 如果需要支持一种新的硬件设备,那么只需要实现一个新的后端。
- 优化阶段是一个通用的阶段,它针对的是统一的LLVM IR,不论是支持新的编程语言,还是支持新的硬件设备,都不需要对优化阶段做修改。
三、编译流程
这里都用clang来举例。通常提到的C/C++编成二进制的四步骤:en
更详细的编译流程:
3.1 预处理
包括宏展开等
clang++ -E main.cpp -o main.i
一个"hello world!"的代码生成的main.i文件有4W行。
3.2 编译
其实编译可以分成3步,main.i经过前端生成main.bc供中端优化,中端优化main.bc生成main.opt.bc(架构无关),后端将main.opt.bc转化成汇编文件main.s(架构相关)。
3.2.1 main.i经过前端生成main.bc供中端优化
# 生成不可阅读的LLVM二进制文件
clang++ -c -emit-llvm main.i -o main.bc
# 生成可以阅读的LLVM IR文件
clang++ -S -emit-llvm main.i -o main.ll
bc和ll文件使用LLVM的工具也可以相互转化
3.2.2 中端优化main.bc生成main.opt.bc(架构无关)
# 使用LLVM opt优化main.bc,优化策略包括 O0 O1 O2 O3 Os Oz等
opt main.bc -O2 -o main.opt.bc
3.2.3 后端将main.opt.bc转化成汇编文件main.s(架构相关)
# 使用LLVM llc生成汇编文件
llc main.opt.bc -o main.s
3.3 汇编
clang++ -c main.s -o main.o
3.4 链接
使用系统链接器ld或者LLVM的链接lld将上边编好的目标文件main.o与依赖的库链接到一起生成可执行文件main.out,就可以直接运行了。