shufflenet v2详解

文章讨论了衡量模型运算复杂度的多个因素,包括推理速度、FLOPs、MACs以及并行等级。特别指出,1x1卷积层的使用对内存消耗有直接影响,而网络的分支程度(串联和并联)会影响GPU和CPU的速度。提出将输入和输出特征矩阵的channel分半来优化效率,尤其在stage的第一个block中,channel会翻倍。
摘要由CSDN通过智能技术生成

1.模型的复杂度

 衡量模型运算复杂度的直接指标是推理速度,flops只是一个间接指标,mac,并行等级等也有影响。此外,在不同平台上消耗时间也是不同的

2.设计高效模型的建议

 这里针对的是1*1的卷积层

hwc1是输入特征矩阵的内存消耗,hwc2是输出特特征矩阵的内存消耗,

c1*c2是卷积核的内存消耗

 

 这里的网络碎片化程度可以理解为分支程度(串联和并联都可以理解为分支)

这里gpu速度一定会变慢,但cpu反可能变快

 总结

 v2

 将出入特征矩阵的channel划分为两部分(一半一半)

 

 对于每个stage的第一个block而言,他的channel是要翻倍的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值