1. 网络结构
最顶上的是主分类器(即最终输出结点),侧边的两个是辅助分类器
2. 网络亮点
- 引入inception结构(融合不同尺度的特征信息)
- 使用1*1的卷积核进行降维和映射处理
- 添加两个辅助分类器帮助训练
- 丢弃全连接层,使用平均池化层(大大减少模型参数)
AlexNet和VGG都只有一个输出层,GoogLeNet有三个输出层(其中两个辅助分类层)
3. inception结构
注意:每个分支所得的特征矩阵高和宽必须相同
图b增加了1*1的卷积核,减少了特征矩阵的深度,从而减少了卷积参数,减少了计算量
4. 辅助分类器
两个辅助分类器结构相同,分别来自inception(4a)和inception(4d)
inception(4a)的输出特征矩阵是
14
∗
14
∗
512
14*14*512
14∗14∗512
inception(4d)的输出特征矩阵是
14
∗
14
∗
528
14*14*528
14∗14∗528
辅助分类器的结构:
- 大小为5*5,stride=3的平均池化下采样层
- 128个卷积核大小为1*1的卷积,并且使用ReLu激活函数
- 节点个数为1024的全连接层,同样使用ReLu激活函数
- 全连接层和全连接层之间适用dropout,以70%的比例随机失活神经元
- 全连接层且使用softmax激活函数(节点个数为类别个数1000)
5. GoogLeNet和VGG的参数对比
VGGNet参数为GoogLeNet的1/20