TVM是一个用于CPU, GPU和专用加速器的开放式深度学习编译器堆栈。它旨在缩小以生产力为重点的深度学习框架与面向性能或效率的硬件后端之间的差距。TVM提供以下主要功能:
- 将Kears, MxNet, Tensorflow, CoreML, DarkNet中的深度学习模型汇编成各种硬件后端的最小可部署模块。
- 基础架构可以在更多的后端自动生成和优化张量运算符(tensor operators),并具有更好的性能。
TVM堆栈始于华盛顿大学计算机科学与工程Paul G. Allen学院的SAMPL小组的研究项目。该项目现在由一个涉及多个行业和学术机构的开源社区推动,并采用基于Apache-style的优点进行模型管理。
TVM提供了两个级别的优化,如下图所示 (引自https://tvm.ai/about,侵删):

TVM是一个深度学习编译器,用于CPU、GPU和专用加速器,旨在提升模型在不同硬件上的性能。它能将多种框架的模型编译为最小部署模块,并进行张量运算符的优化。TVM包含计算图优化和张量运算优化两层,提供了高级运算符融合、布局转换和内存管理等功能。
订阅专栏 解锁全文
2756

被折叠的 条评论
为什么被折叠?



