论文讲解——TPU-MLIR: A Compiler For TPU Using MLIR

算能开发者社区

于 2023-08-10 09:00:00 发布

阅读量909

点赞数

文章标签： mlir

本文链接：https://blog.csdn.net/lily_19861986/article/details/132200149

版权

https://arxiv.org/pdf/2210.15016.pdf

本文将对TPU-MLIR的论文进行讲解，介绍其编译流程及内部工作机制，帮助读者在之后的开发流程中更好地开源。

在这里插入图片描述

TPU-MLIR概括有如下四个特点：

多框架统一处理 ，支持多种神经网络框架（pytorch/onnx/tensorflow/paddlepaddle等），且处理流程完全统一；
分层设计 ，将网络模型抽象成2层处理：
1. TOP层，与芯片无关层，包括图优化、量化、推理等等；
2. TPU层，与芯片相关层、包括权重重排、算子切分、地址分配、推理等等；
正确性保证，
1. TOP层推理结果与ONNX结果对比验证，确保一致；
2. TPU层推理结果与TOP层对比，确保精度可靠；
3. Cmodel推理结果与TPU层对比，确保硬件一致性；
  4.过程可跟踪，每一步的转换可以生成MLIR，用于跟踪和调试。

在这里插入图片描述

ONNX
Caffe
TFLite
Pytorch/Tensorflow/PaddlePaddle --> ONNX
ONNX提供了丰富的算子和一些基础数据类型，其通过多个node来定义计算图，每个node定义了输入（input）、输出（output）、类型和属性等，输入输出都是符号（symbol），通过这些符号的关系来确定计算依赖，完成计算图的定义。

Pytorch/Tensorflow/PaddlePaddle --> ONNX过程由外部工具完成。