一、简介
在本章中,我们将介绍学习googleNet(ImageNet 2014上的获奖架构)及其入门层。
googleNet具有22层,参数几乎减少了12倍(与Alexnet相比,速度更快,更少,而且准确性更高。
他们的想法是制作一个也可以在智能手机上使用的模型(将计算预算保持在15亿左右的预测值上)。
二、GoogleNet
起始层:
起始层的想法是要覆盖更大的区域,同时还要为图像上的少量信息保持高分辨率。 因此,想法是将不同的尺寸并行排列,从最精确的详图(1x1)到较大的详图(5x5)。
这个想法是,一系列大小不同的gabor滤波器将更好地处理多个对象的缩放比例。 优点是初始层上的所有过滤器都是可学习的。
提高深度学习性能的最直接方法是使用更多层和更多数据,googleNet使用9个初始模块。 问题在于更多的参数也意味着您的模型更容易过拟合。 因此,为避免参数在初始层爆炸,将利用所有瓶颈技术。
使用瓶颈方法,我们可以使用更多的非线性和更少的参数来重建初始模块。 还添加了一个最大池化层,以汇总上一层的内容。 所有结果都一个接一个地串联在一起,并提供给下一层。
Caffe示例:
在下面,我们从原始googleNet的层叠中展示2个初始层。