By-元戎感知组
最近又重温了一把LLVM Developer Conference一个tutorial,记录一下之前的一些观后感。整个tutorial还是非常适合没有LLVM基础的人入门跟手操一段LLVM代码的。
Prerequisite
IR->intermediate representation也就是所谓的中间表示形式。一般来说编译器会使用的IR包含了DAG,三地址码(靠近目标机器),CFG(控制流图),SSA(比较常见的,single static assignment),CPS(更加一般的SSA)。其中SSA由于每个变量仅被赋值一次更加容易做整个IR的分析以及其他的优化包含(constant propagation)。其他的IR形式这边就不多少了,需要的话再一一开坑。
文件格式:
1. bc bitcode 2. ll 中间表示文件
有用的工具:
1. llvm-dis 反汇编工具将bc文件转为ll文件
2. llvm-as 汇编工具将ll文件转为bc文件
3. clang/clang++这两者分别都是LLVM的前端parser也就是编译器工具
4. opt用来check或者优化或者转化IR文件, e.g. opt --verify x.ll
Example
先准备一个小例子
// filename main.cpp
int main() {
return 0;
}
//clang -S -emit-llvm main.cpp
//可以看到了产生了ir文件main.ll
打开main.ll文件
; ModuleID = 'main.cpp'
source_filename = "main.cpp"
target datalayout = "e-m:o-i64:64-i128:128-n32:64-S128"
target triple = "arm64-apple-macosx11.0.0"
; Function Attrs: noinline norecurse nounwind optnone ssp uwtable
define i32 @main() #0 {
%1 = alloca i32, align 4
store i32 0, i32* %1, align 4
ret i32 0
}
attributes #0 = { noinline norecurse nounwind optnone ssp uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "frame-pointer"="non-leaf" "less-precise-fpmad"="false" "min-legal-vector-width"