一、为什么要把模型放到移动端
1、用户体验:可用性较高
2、成本:服务器成本较高
3、用户隐私:如语音、视频
二、AI模型开发部署流程
在服务端通过GPU集群的方式进行模型训练,然后把训练好的模型通过模型文件的方式导出,做一些格式转换,再通过移动端深度学习框架部署在移动端智能设备上
三、基于mace的落地实践
1、硬件选型
2、框架适配
通过ONNX格式
3、性能优化
优化瓶颈:如卷积计算,
优势:存储量表变少,访存带宽减少
访存量会增加
4、工程部署
五、趋势和展望