如何让手机快速运行AI应用？这有份TVM优化教程

最新推荐文章于 2023-05-27 14:46:23 发布

weixin_33946605

最新推荐文章于 2023-05-27 14:46:23 发布

阅读量213

点赞数

文章标签：嵌入式人工智能

原文链接：https://yq.aliyun.com/articles/389976

版权

本文来自AI新媒体量子位（QbitAI）

在移动设备上部署深度神经网络的需求正在快速增加。

和桌面平台类似，GPU也能在移动平台加速推理速度、降低能耗。但问题是，大多数现有深度学习框架并不能很好的支持移动GPU。

为什么会这样？因为移动GPU和桌面GPU在架构上存在差异。

所以想要利用移动GPU，还得进行专门的优化。这种额外的工作，最终导致的结果就是大多数深度学习框架都对移动GPU的支持不足。

TVM通过引入一个统一的IR堆栈来解决不同硬件平台的部署问题。使用TVM/NNVM可以为ARM Mali GPU生成高效内核，并且进行端到端的编译。

基于Mali-T860 MP4的测试结果表明，与Arm Compute Library相比，上面这个方法在VGG-16上快1.4倍，在MobileNet上快2.2倍。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在郑怜悯发表的这篇文章中，他还从GPU架构、卷积为例的优化等方面进行了更为详细的阐述。我们在这里就不详细复述。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

640?wx_fmt=png&wxfrom=5&wx_lazy=1

这篇文章的原文地址：http://tvmlang.org/2018/01/16/opt-mali-gpu.html

关于TVM和NNVM，量子位之前也有报道：

关于郑怜悯同学的研究，还有另一个好玩的事情：

不好，两群AI打起来了！

本文作者：允中摘录编译

原文发布时间：2018-01-21

weixin_33946605

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何让手机快速运行AI应用？这有份TVM优化教程

本文来自AI新媒体量子位（QbitAI）在移动设备上部署深度神经网络的需求正在快速增加。和桌面平台类似，GPU也能在移动平台加速推理速度、降低能耗。但问题是，大多数现有深度学习框架并不能很好的支持移动GPU。为什么会这样？因为移动GPU和桌面GPU在架构上存在差异。所以想要利用移动GPU，还得进行专门的优化。这种额外的工作，最终导致的结果就是大...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。