一、简介
google发表的文章 http://arxiv.org/pdf/1512.00567v3.pdf中包含了inception v2与inception v3两种模型配置。
Inception v3单模型达到了21.2%的top1错误率,多模型达到了17.3%的top1错误率。
二、网络分析
文章地址如下: http://arxiv.org/pdf/1512.00567v3.pdf。
其设计思路的直觉是:
1. inception做了比较巧妙的几个动作,在增加特征表达能力的同时减少计算。
2. 模型更精巧复杂了,增加BN和gradient clipping去稳定训练。
其网络结构可以参考mxnet上的http://data.dmlc.ml/mxnet/models/imagenet/inception-v3.tar.gz。
网络中有如下的细节:
1.没有大的卷积核了,5x5用两个3x3代替,如图所示:
2.两个3x1代替3x3卷积核,如下图所示:
inception v2如下图所示:
三种inception种类如下:
v2结构如下:
inception v3是所有如下v2的结合:
其准确率是最后一行,v3在raw的v2上做了如下变化:RMSProp替代SGD,在类别全连接层后加入 LSR层,将7x7卷积核由三个3x3卷积核替代。