SqueezeNet

Paper : SqueezeNet: AlexNet-Level Accuracy with 50x Fewer Parameters and <0.5MB Model Size
Code : torchvision

摘要

SqueezeNet是着重强调模型压缩的卷积网络模型,准确率与AlexNet相当但是参数规模只有AlexNet的1/50,在模型压缩技术的支持下,SqueezeNet可以压缩到<0.5MB。虽然理论上减少了50倍的参数,但是AlexNet本身全连接节点过于庞大,50倍参数的减少和SqueezeNet的设计并没有关系。0.5MB的模型要得益于模型压缩技术,不使用模型压缩技术的话从网络结构的角度来考虑优化幅度并没有那么大。

网络结构

SqueezeNet的模型压缩使用了3个策略:

  1. 将3*3卷积替换成1*1卷积
  2. 减少3*3卷积的通道数
  3. 将降采样后置:作者认为较大的Feature Map含有更多的信息,因此将降采样往分类层移动。虽然会提升网络的精度,但是会增加网络的计算量。

Fire 模块:SqueezeNet是由若干个Fire模块结合卷积网络中 卷积层,降采样层,全连接等层组成的。一个Fire模块由Squeeze部分和Expand部分组成。Squeeze部分是一组连续的1*1卷积组成,Expand部分则是由一组连续的1*1卷积和一组连续的3*3卷积连接组成,注意3*3卷积需要使用same卷积。在Fire模块中,Squeeze部分1*1卷积的通道数记做 s 1 × 1 s_{1\times 1} s1×1,Expand部分1*1卷积和3*3卷积的通道数分别记做 e 1 × 1 e_{1\times 1} e1×1 e 3 × 3 e_{3\times 3} e3×3。在Fire模块中,作者建议 s 1 × 1 < e 1 × 1 + e 3 × 3 s_{1\times 1}<e_{1\times 1}+e_{3\times 3} s1×1<e1×1+e3×3,这么做相当于在两个3*3卷积的中间加入了瓶颈层,实验中的一个策略是

s 1 × 1 = e 1 × 1 4 = e 3 × 3 4 s_{1\times 1} = \frac{e_{1\times 1}}{4} = \frac{e_{3\times 3}}{4} s1×1=4e1×1=4e3×3

可视化后如下图所示

image.png

image.png

整体的网络结构如下,分别是SqueezeNet,SqueezeNet(shortcut),SqueezeNet(complex shortcut,使用1*1进行通道对齐)

image.png

参数表如下

image.png

核心观点

  1. 文章提出了SqueezeNet这一结构,将1*1卷积核的作用做了进一步扩展,提出使用1*1卷积核代替3*3卷积核进行参数压缩这一观点
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值