llvm是一个提供编译功能的一组库函数,包括了全流程的定制和优化,是基于中间码实现的。优化工作集中在后端,可以有效跟前端的具体语言分开,算法上更加独立。跟gcc不一样的是,llvm是基于模块化设计的,提供的是机制和函数,而不是一个整体的编译器。有了这些基本的模块之后,我们就可以像搭积木一样完成自己想要的功能。这正是llvm的强大之所在。下面是典型的llvm处理流程:
对于一个用户来说,最重要的是需要把前端语言翻译成中间码形式,接下来的事情就交给llvm,llvm会对中间码进行优化处理,然后生成host代码。由于llvm提供了丰富的api,这使得翻译的过程比较简单。
llvm的基本概念:模块,函数,翻译引擎,基本块,指令。模块是llvm的基本单位,跟我们一般意义上理解的一致,模块由函数组成,函数由基本块组成,基本块由指令组成。翻译引擎负责将翻译工作,当然还有优化模块等等。这些关系跟objdump之后的汇编结构是一致的。