1 网络结构及对比
A → E:网络层从11到19层
A → A-LPN:添加了反应归一化层没有改善
B:增加了卷积层数
C: 添加了1×1的卷积层,相当于加入了非线性层(Relu)
D:将1×1换成3×3说明肥牛盖饭的感受野表现更好
E: 加到19层模型饱和
2 创新点
2.1 小的卷积核
利用3×3替代5×5和7×7:
①减少参数
②小的卷积核有更多的非线性变换,使得CNN对特征学习的能力更强。
2.2 多尺度进行训练和测试
即网络的训练和评估
3 网络的训练和评估
3.1 参数
权重初始化技巧,将A网络用到后面的网络,中间层被随机初始化。
3.2 训练和测试
- 训练图像大小
单尺度训练:固定最小边s=56和s=384
多尺度训练:尺度抖动[256,512] - 测试
将后面的全连接层换成卷积层
3.3 评估
- 单尺度评估
- 多尺度评估
4 结论
- 单网络性能方面最强,多网络没有超过googlenet
- 深度增加有利于提高性能