1.模型的复杂度
衡量模型运算复杂度的直接指标是推理速度,flops只是一个间接指标,mac,并行等级等也有影响。此外,在不同平台上消耗时间也是不同的
2.设计高效模型的建议
这里针对的是1*1的卷积层
hwc1是输入特征矩阵的内存消耗,hwc2是输出特特征矩阵的内存消耗,
c1*c2是卷积核的内存消耗
这里的网络碎片化程度可以理解为分支程度(串联和并联都可以理解为分支)
这里gpu速度一定会变慢,但cpu反可能变快
总结
v2
将出入特征矩阵的channel划分为两部分(一半一半)
对于每个stage的第一个block而言,他的channel是要翻倍的