Yolov3模型框架darknet研究(六)在cpu上运行yolov3完整版模型所需要的内存大小

背景

前几天我同事在2G内存的linux服务器上想基于darknet框架运行yolov3完整版模型(即106层网络结构),结果发现内存不够。这里面引出一个话题,在cpu上基于darknet来加载、推理yolov3完整版到底要耗费多大内存? 

实验代码

下面实验数据是win10上面基于darknet_AB框架运行608x608的yolov3完整版模型所得。注意,如果网络size为416x416,那相应的所耗费内存要少些。 

分析darknet框架代码,发现它的整体思想是, 现基于cfg文件来在内存中创建一个巨型网络(也可以看成大的结构体),然后load weights文件(本质是将前面结构体成员都填充上相应的值),最后将input image依次按循序和网络中各层权值做乘加运算。

在内存中创建网络的代码是

network net = parse_network_cfg_custom(cfgfile, 1);

该函数内部会根据不同的layer类型来创建layer,也即分配内存空间。为了统计每一层所分配内存,仿照bflops计算方法,首先在struct layer结构体里面添加一个成员:int calloc_mem;

然后在每一层中分配内存后添加语句来累加内存,如下所示:

最后在该函数(创建层)末尾,做一个B到MB转换,并打印出来:

 l.calloc_mem = (int)(l.calloc_mem / (1024.0f*1024.0f) + 0.5);
    fprintf(stderr, "%5d %2d x%2d /%2d  %4d x%4d x%4d   ->  %4d x%4d x%4d %5.3f BF  %dMB\n",
        n, size, size, stride, w, h, c, l.out_w, l.out_h, l.out_c, l.bflops, l.calloc_mem);

最后,仿照bflops,定义一个总的内存大小变量来对每一层所分配内存 进行相加。并打印出来。

结果

一部分layers所分配内存如下所示

总的所耗内存为:

 结论

 从上得知,基于darknet框架,对于608x608大小的yolo3完整版模型,所需要内存2GB左右,这也解释了为什么2GB大小的服务器不能运行该模型。  此外,对于同样模型,如果使用opencv来加载和推理,却大概只需要700MB左右的内存。下次分析一下opencv下为什么只需要1/3左右的内存。 

 

  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ltshan139

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值