1. GoogLeNet
GoogLeNet提出于2014年,在当年的ILSVRC(ImageNet Large Scale Visual Recognition Challenge)图像分类竞赛上夺得冠军。这个网络使用了Inception模块,Inception模块与全连接层相比拥有了更高的效率,模块内不含全连接层并且参数的数量是AlexNet的十二分之一,整个网络是由一个一个的Inception模块堆叠起来的。
在自己设计网络结构时我们需要考虑设定的卷积核的大小的问题,GoogLeNet的Inception模块就给我们提供了一种解决方案:分别使用不同尺度的卷积核进行卷积,再将这些卷积核堆叠起来传输到下一层。正是使用了不同尺度的卷积核,对原图上的特征无论大小都能捕捉到。原始版本的Inception模块中使用了5×5、3×3、1×1三个大小的卷积核做卷积处理和一个3×3的最大池化处理,将这四个特征图叠在一起作为一层的输出。
原始版本的Inception模块
但在原始版本的Inception模块中,由于使用了多尺度的并行卷积,经过一层Inception模块后输出的厚度是四个部分