TVM源码学习与实践
文章平均质量分 90
通过实践分析TVM源码,学习TVM原理
牧世
这个作者很懒,什么都没留下…
展开
-
【TVM系列二】TVM介绍
文章同步更新在公众号 AIPlayer,欢迎扫码关注,共同进步目录一、TVM的工作流程1、整体流程2、关键数据结构3、Transformations4、搜索空间和基于机器学习的转换5、目标代码转化二、逻辑架构组件三、运行TVM实例1、交叉编译runtime2、编译模型3、运行模型四、总结一、TVM的工作流程TVM主要由两个部分组成:(1)TVM编译器:负责编译和优化模型(2)TVM runtime:提供目标设备上运行模型的API..原创 2021-11-23 08:57:51 · 5739 阅读 · 0 评论 -
【TVM系列三】算子转换调用流程
文章同步更新在公众号 AIPlayer,欢迎扫码关注,共同进步目录一、前言二、TVM代码结构三、 前端流程四、算子relay转换五、Relay到TOPI实现的调用过程六、总结一、前言本文将从源码分析一个算子在TVM中是如何从前端到后端的转换过程。首先来看一下keras模型编译推理的一个示例。通过pip安装好keras和tensorflow,按照TVM官方文档的示例进行一些修改,因为环境配置的不同,python包的导入以及编译target进行了修改,示例使用c..原创 2021-11-23 09:06:32 · 1147 阅读 · 0 评论 -
【TVM系列四】模型编译与运行过程
本文主要介绍了TVM模型编译与运行过程中的代码流程。原创 2022-10-17 08:35:07 · 730 阅读 · 1 评论 -
【TVM系列一】开发环境搭建
一、前言众所周知,深度学习的计算量庞大,在追求效率与实用性的工业界,深度学习所面临的一个最大的问题就是如何在不影响模型精度的前提下将算法模型部署到目标硬件平台上进行高效的前向计算。和单纯研究相比,在工业界主要遇到了两个问题: 深度学习框架众多,caffe / mxnet / tensorflow / pytorch训练出来的模型都彼此有不同的分发格式,对于部署有环境兼容的问题。 硬件价格昂贵,一些嵌入式平台没有使用GPU的条件。同时一些人也开始在做FPGA/ASIC的深度学习加速卡。原创 2021-11-23 08:46:25 · 1719 阅读 · 0 评论