引言 TVM不仅仅是一个编译器,也可以看做一个编程模型。他的计算与调度分离的哲学使得用户无需关心后端代码的执行优化。 TVM 如何对算子进行优化? TVM针对CPU、GPU、ASIC(FPGA)三个硬件后端做了统一的端到端的后端优化,现在我们剥离图优化层,单拎出来对不同后端的算子优化做出解释。 不同的硬件特性导致对统一个算子的优化也会有不同的影响,FlexTensor文章列出了针对不同后端的优化技术。 TVM对不同的优化技术提出了多种调度原语,包括: