【Android-NCNN-Vulkan】ncnn-vulkan load param & model 速度慢

最新推荐文章于 2024-09-10 09:53:03 发布

二十四桥下一句

最新推荐文章于 2024-09-10 09:53:03 发布

阅读量1.4k

点赞数

分类专栏： ncnn Android vulkan 文章标签： Android Vulkan NCNN

本文链接：https://blog.csdn.net/lgh0824/article/details/107103936

版权

4 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

模型作用：人脸检测，人脸关键点检测

模型：fd.param fd.model，fl.param fl.model

设备1：ARM A53 2.0GHz, IMG GE 8300

OnePlus6T ：Snapdragon 845, Adreno 630

	FD Param	FD Model	FL Param	FL Model
size	10kb	509.6kb	46kb	2.5mb

Load Param/Model 高耗时问题，主要有两个操作

VkResult ret = vkCreateComputePipelines(vkdev->vkdevice(), 0, 1, &computePipelineCreateInfo, 0, &pipeline);

int ret = resolve_shader_info(spv_data, spv_data_size, si);

关于 vkCreateComputePipelines 的操作
- 目前该操作占据运算时间45%
- 且在create pipeline过程中调用次数非常多，本身耗时在设备1上超过10ms
- 如何优化该函数？
关于 resolve_shader_info(在线编译）的操作
- 目前该操作占据运算时间45%
- 优化方案一：采用shader的离线编译，OnePlus6T上显示能够提升5倍的速度;
- 优化方案二：在离线基础上，计划通过删除没有用到的shader来加快pipeline的创建;
- 优化方案三：加入pipecache机制，同比之前 load param 降低 8s，load model降低50-80s，pipeline cache效果很明显
单独Load FL model (GPU)