移动端深度学习框架——绝影简介

最新推荐文章于 2021-11-26 10:36:25 发布

夕阳叹

最新推荐文章于 2021-11-26 10:36:25 发布

阅读量4.7k

点赞数 2

分类专栏：异构计算/算法优化文章标签：深度学习 neon CNN 移动端高性能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jxt1234and2010/article/details/78661965

版权

异构计算/算法优化专栏收录该内容

14 篇文章 14 订阅

订阅专栏

绝影（Prestissimo）

绝影是九言科技开发的高性能移动端深度学习框架，其项目地址见

https://github.com/in66-dev/In-Prestissimo

背景

绝影前身是一个GPU方案：http://blog.csdn.net/jxt1234and2010/article/details/71056736

为了最好的兼容性，我们把引擎模块(各个Layer的运算逻辑)用 cpu 重写，并做汇编级优化，经过3个多月的开发后，绝影性能超过了当时所有的开源框架（caffe、tensorflow等等），人像分割的性能也达标了，于是商用上线。

后面绝影进一步优化以及扩展功能，这段时间， ncnn、 mdl 先后开源，作为过来人，我们深知中小企业缺乏移动端框架的痛苦，因此我们将绝影开放，以期推动AI行业共同进步。

特性说明

性能

绝影分float和int两个计算分支，int性能高，但会牺牲一定精度。大部分网络用int的精度便已经足够，对于少数复杂的网络int的计算会有误差，可以用float分支作对比。

项目文档中有性能测试的对比报告，绝影的int计算分支单线程的性能就快于所有开源框架的多线程版本。

具体使用的优化技巧不外乎浮点转定点、除转乘、指令重排、neon、unroll、winograd 等等，难点不在于优化技巧，而在于每一步都下苦功夫去实现。

支持网络

详细的支持情况参看项目文档，简单来说，是支持人像分割(Resnet)、人脸检测（mtcnn）、目标检测（faster-rcnn）这几个网络。

另外，为了开发者调试方便，所有网络中间结果都会保留着，这会使得绝影占用的系统内存稍大。

API使用

API的使用重点看 android demo 的 jni 部分，先建factory，然后由模型和factory建net，每次运算时先填inputImage，运行完成后由outputImage取数据。

之所以将factory和net分开，以及用 vUpload 和 vDownload 上传下载数据，是为了支持异构计算（CPU、GPU版本可共用一套框架）。

InAPI

由于去除了专作接口层和基本图像处理优化的 fastcv 支持，绝影的入和出（Bitmap->buffer 和 buffer->Bitmap）可能会产生额外性能损耗。如果超出了预期请自行用neon解决。

框架对比

已经开源的框架的性能测试对比附在项目文档中。绝影和ncnn、mdl等等的性能并不在一个层级上，没什么好对比的。可以对比的是一些不开放的商用框架。

商汤的 PPL

作为中国著名的AI创业公司，商汤的ppl一直是他们的核心竞争力之一。

参考这里面高洋的回答
https://www.zhihu.com/question/62871439
Cortex-A57单核2.1GHz
PPL 单线程跑 SqueezeNet v1.1 68ms

没有同类机器对比，也不确定他们是64位还是32位的版本，参考绝影在 Mate 8 （2.3GHz）上的速度57ms，大致持平。

支付宝的xNN

http://geek.csdn.net/news/detail/238369

“xNN在Qualcomm 820 CPU上能够输出29.4 FPS的前向预测帧率，在苹果A10 CPU (iPhone 7)上的帧率则达到52.6 FPS”。

按这个数据，iphone7上面的SqueezenetV1.1的耗时为 19ms，跟绝影多线程版差不大多。

模型支持度、以及模型压缩方面比绝影做得好（单看它的宣传来说），这方面的技术我们还在开发中。

鸣谢

感谢老大冬冬的支持，兄弟团队的小伙伴也十分给力，列一下花名，排名不分先后：乐涤、汤圆、咖啡、可召、晨晨。

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。