论文:ShuffleNet V2: Practical Guidelines for Ecient CNN Architecture Design
论文链接:https://arxiv.org/abs/1807.11164
代码:
因项目需要跑了ShuffleNet V2,发现比resnet50足足快了60ms,识别率也能满足项目需求。看了论文,特来分享。
ShuffleNet V2主要对目前一些主流网络进行多组对比实验,并从这些对比实验中进行一定的理论分析和总结,最后得出4条关于 CNN 网络结构设计的准则,帮助设计高效的神经网络结构。下面先贴出文中观点:
2个问题:
(1)FLOPs(浮点计算量)不能作为衡量目标检测模型运行速度的标准,因为计算速度跟平台框架、硬件设备还有关;
(2)MAC(Memory access cost)也是影响模型运行速度的一大因素;
衡量模型运行速度,应采用如运行时间(speed\runtime)这样的指标。建议在GPU上,使用Batches/sec进行速度衡量;在ARM上,使用Images/sec进行衡量。
4条网络设计准则:
G1:卷积操作时,输入通道数尽量等于输出通道数(卷积核数量)可降低M