上一章介绍了从宏观上看LLVM需要补充什么东西,从这一章开始我们逐个讲各部分需要的代码。
桔里猫:用LLVM写一个芯片编译器(二)——从无到有需要写什么东西119 赞同 · 8 评论文章编辑
本部分我们首先介绍芯片的整体架构部分。这一部分可能稍微有点儿枯燥,没有讲寄存器和指令那么的清晰明了,但它确实是LLVM编译器的入口,首先就要完成这一部分代码, 所以需要耐心看完。

如上图,首先回顾一下这个部分需要写什么东西。我们挑重点讲。
1. Smallbird.h
这个文件是我们要完成的第一个文件,其实就是申明了两个类,方便后续引用。

后续可以把全局的宏定义写到这个里面。
没有其他东西了,毫无技术含量^^
2. Smallbird.td
接下来我们写Smallbird.td。emmm 这个文件主要定义整体架构层面的东西。
2.1 定义一些subtarget Features
例如我们定义两个feature, 支持SLT,和支持Cmp指令。

然后为了方便,定义这些feature的集合。

例如定义个SmallBird32II特性,包含Cmp和Slt.
这部分其实是利用tablegen来完成的,基类是SubtargetFeature。后续我们可以确定我们某个subtarget带不带某个feature。
至于这个subtargetFeature, 显然用的是LLVM提供的接口。

没有太多内容,就是定义了一下名字,描述之类的。
2.2 定义一些subtarget Features
然后就是定义几个Processor。。。这个Processor带了某个特性。

例如上面就定义了两个subtarget处理器,一个含有FeatureSmallBird32I特性,另一个含有FeatureSmallBird32II特性。
2.3 把架构定义出来

3. SmallBirdTargetMachine.cpp/h
3.1 定义我们的target类
这部分h文件描述我们的TargetMachine类。这个类包含了各个subtarget类的一个map。
从LLVMTargetMachine里继承出我们的SmallBirdTargetMachine类。

其实可以理解为对subtarget的管理,提供了接口,可以方便的拿出我们需要的subtarget。
(你不知道为什么要拿到subtarget类?看上一章)
当然,为了使用方便,我们还能用SmallBirdTargetMachine还可以派生出大小端的类。
![]()
3.2 注册我们的target类
在C文件里,比较重要的是我们需要调用一个LLVM的库函数,把我们写的类注册给LLVM。

3.3 实现我们的PassConfig
此处在C文件里直接实现SmallBirdPassConfig类,继承自TargetPassConfig, 用来配置我们Target的Pass。
(什么叫Pass: 就是一个处理过程,例如程序选择就是一个Pass, 不太清楚的话看第一章)

例如上面的代码就是重载了addInstSelector, 注册了我们自己写的指令选择器。
4.SmallBirdMCTargetDesc
这部分代码正式生成Target对象,并把各种类都注册给LLVM。具体注册了些什么见cpp文件。
主要在LLVMInitializeSmallBirdTargetMC()里,

把target, asminfo, inst, reg, subtarget等等类全部注册给LLVM。
5.SmallBirdbaseInfo
这是个.h文件,倒是比较简单。定义了两个枚举类型,
Target Operad Flag, 操作数前缀。
![]()
还有就是指令类型的enum

没什么其他内容了,比较简单。
6.SmallBirdTargetInfo
这个文件贼简单,主要就是实现一个函数gettarget,让我们获取到target类。

7.SmallBirdSubTarget
emmm 然后来到了最重要的一个类。这个类前面讲过,是个接口类,主要定义了一系列subtarget对外的接口。
这个地方subtarget有哪些我们在td文件中定义过,此处写成一个enum, 显然,td文件要和.h文件对上。

所以我们可以看出,td文件和cpp/.h文件是要配合使用的,两个剥离开了理解是非常痛苦的一件事儿。类里定义了一堆借口。

例如上面这样的,返回的全是各类的指针。
8. 几个容易混淆的概念
上面这部分代码重点已经讲完了。你可能看到这儿有几个点有疑惑,这儿解释一下。
Target和SubTarget的区别:Target说的是一类芯片,例如ARM是一个Target, SubTarget是具体的一个芯片,例如ARM的M3。这也很好理解,一个系列的芯片总有不同的特征的,有些支持slt, 有些不支持,把这些特性总结成feature, 然后定义各种subtarget即可。否则岂不是要写若干编译器><
Target和TargetMachine区别:Target是信息层面的类,比如Target叫什么,有哪些特征。TargetMachine是操作层面的类,用于管理subtarget的。
9. 总结
本章是我们从LLVM森林看到LLVM树木的第一章。介绍了我们如何在LLVM上定义出我们的架构,方便后续添加枝叶进去。可能有点晦涩,可对照代码来读。下一章讲的内容应该更好懂,下一章我们讲讲如何添加寄存器信息进去。
1385

被折叠的 条评论
为什么被折叠?



