MNN通用端侧深度学习预测框架介绍

最新推荐文章于 2024-04-01 01:29:15 发布

Garvin Li

最新推荐文章于 2024-04-01 01:29:15 发布

阅读量1.7k

点赞数

分类专栏：机器学习文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/buptgshengod/article/details/114711209

版权

117 篇文章 19 订阅

订阅专栏

最近端侧的AI模型应用越来越广泛，在端侧的模型应用会面对很多的问题，比如模型适配性和机型适配性，还有计算性能方面的问题。是否有某种框架可以解决这些端侧AI模型遇到的问题，Google、苹果等公司都有相关的工作。今天介绍下MNN框架，由阿里巴巴开源的一款专注于端侧深度学习模型预测框架。

MNN核心解决的问题

首先看下MNN的核心功能架构图：

MNN主要解决了三方面的问题：

Model compatibility：模型多样性的兼容问题，比如来自TensorFlow、PyTorch、Caffe的模型全部兼容，甚至ONNX格式的模型也兼容
Resource limitation：在端侧为了更好地解决性能问题，MNN做了很多框架层面的优化问题
Device diversity：手机端不同品牌的手机系统兼容性一直是嵌入式开发的痛点，作者当年创业做手机应用的时候就被这个问题折磨很久。MNN框架不光适配了Android、IOS等系统，更对不同硬件环境的手机进行了适配，比如对手机侧的CPU、GPU分别作了一定适配。

接下来看下MNN技术架构图：

MNN的整体技术架构分为两个大模块：

Offline conversion：离线的模型转换模块，在这个模块需要把不同格式的模型进行格式转换，生成MNN可以接受的格式。另外还需要做计算图优化和模型压缩，是得模型的体检减小
On-device Inference：在线模型预测模块，在在线预测模块提供3个优化策略，分别是pre-inference、operator-level optimization和backend abstraction