MLIR(multi-level IR)
首先,在现在的编译器里面是存在IR(Intermediate presentation)的概念的。这个IR的概念是为了在编译器的不同阶段来代表本层的语言的。例如说对于一些编译器的前端,是使用计算图来表示;对于一些后端,可能会使用一些DSL的表示形式。那么这些层之间来回转换这种中间表示就会存在复用性,开销,人力等问题。所以google就想用MLIR来统一所有的IR的表示。我的理解(如果有不对的地方,欢迎大家一起讨论),MLIR使用一种叫做方言(dialect)的形式来实现不同层之间的翻译的工作。
Dialect
方言有点像对于一个基类派生出的对象的感觉。不同IR层是由共性的:数据形状,数据类型,计算规则。那么MLIR就提取共性的抽象表达,然后针对lowering过程中每一层,针对该层需要补充的东西,在原有的像基类一样的基础上实例化不同层。这样就可以尽可能少改变每一层IR的表达代价。同时复用IR。
MLIR中支持稀疏的表达
基础概念
sparse tensors
- A vector with many zero elements is called a sparse vector
- A matrix with many zero elements is called a sparse matrix
- A tensor with many zero elements is called a sparse tensor <