【阅读笔记】《ShuffleNet V2: Practical guidelines for Efficient CNN Architecture Design》

本文记录了博主阅读《ShuffleNet V2: Practical guidelines for Efficient CNN Architecture Design》中记录的笔记。更新于2018.12.24。

文中主要观点

  1. FLOP无法等同于算法的计算量,原因在于:1)没有考虑memory access cost(MAC,内存访问损失);2)degree of paprallelism(并行度);3)运行算法的平台。因此,文中建议用direct metric,且应当将traget plateform(即平台)考虑进去。

以下为Guidelines:

  1. 前后通道数差距越大,速度越慢;速度在输入输出通道数等同时达到最小。
  2. 过多的group会导致MAC的上升:作者建议根据平台的情况和具体任务谨慎选择group的个数,切勿单纯为了增加通道数而应用大量的group。
  3. 碎片化的网络(Network fragment)会严重导致速度下降(ARM降低较少,GPU降低明显)。
  4. 像素级运算的计算量不可忽略:这里的像素级运算包括ReLU、AddTensor、AddBias和depthwise convolution。

更多内容,欢迎加入星球讨论。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值