QQ Group: 428014259
Tencent E-mail:403568338@qq.com
http://blog.csdn.net/dgyuanshaofeng/article/details/80195971
作者:Forrest N. Iandola, Song Han, Matthew W. Moskewicz, Khalid Ashraf, William J. Dally, Kurt Keutzer
单位:DeepScale; UC Berkeley; Stanford University
0 摘要
对于给定准确率水平,存在不同结构的卷积网络。小卷积网络结构至少具有三点好处:1、需要较小通信communication;2、需要较小带宽bandwidth;3、更为可行地部署在FPGA或者其它硬件上。提出SqueezeNet,其达到AlexNet水平的准确率,但小50倍参数量。【如果AlexNet有100MB,那么SqueezeNet仅具有2MB】另外,如果采用模型压缩技术model compression,那么可获得0.5MB的SqueezeNet,其比AlexNet小510倍。
1 介绍和动机
详细介绍摘要里面的三点好处。
属于人工搜索卷积网络结构。
2 相关工作
2.1 模型压缩
Denton等人采用SVD压缩预训练卷积模型。【第一层卷积和全连接层】
Han等人提出Network Pruning。【低于权重阈值的参数置零-稀疏卷积网络迭代】
Han等人提出Deep Compression。
2.2 卷积网络微型结构
卷积核是3D的,具有高、宽和通道。
GoogLeNet使用Inception modules。
作者把building blocks或modules称为卷积网络微型结构。
2.3 卷积网络大型结构
就是整个卷积网络。
把Residual Networks和Highway Networks的跳跃结构称为bypass connections。
2.4 神经网络设计空间探索
3 SqueezeNet 挤压网络
3.1 设计策略
介绍设计策略,引入Fire module,设计策略+Fire module构建SqueezeNet。
策略1:利用 1 × 1 1 \times 1 1×1滤波器替代 3 × 3 3 \times 3 3×