1 简介
Inception网络是为解决图像内容差异不能有效提取图像信息问题而提出的,核心是将某一层网络卷积核拆分成不同尺寸的卷积核,如3×3的卷积核拆分成1×1,3×3的卷积核,增加输出网络层的尺寸,如30×30,步长为1,使用3×3的卷积核,不填充,输出的图像尺寸28×28,若使用1×1和3×3的卷积核,提取图像信息,输出深度图层尺寸为30×30和28×28,获取的图像信息较单一卷积核丰富,同时小卷积核可提取更小目标的信息,更有效利用图像信息。普通卷积神经网络如图1.0, Inception基本结构如图1.2所示。从GoogleNet(Inception v1)之后,衍生出v2,v3和v4,其中v2和v3是对卷积核进一步拆分,而v4引入了ResNet(残差网络)保证模型精度的情况下增加网络层。
2 Inception系列网络
【GoogleNet】
GoogleNet第一次提出Inception概念,并设计了22层(不包括池化层)的网络结构,称为Inception V1,核心结构如图2.1所示。
2.1 Inception V1
如图2.1所示,在Inception基础上,添加1×1的小卷积核,降低数据维度,减小计算开销。
2.2 Inception V2
将Inception V1中的5×5卷积核拆分为两个3×3的卷积核。
2.3 Inception V3
将Inception V2中的3×3卷积核拆分为两个n×1和1×n的卷积核,其中n=7。
2.4 Inception V4
分别在V1,V2和V3基础上添加残差连接,即把某一卷积计算的输出和输出直接连通,同维度直接计算,不同维度进行卷积转换后连接,保证模型精度情况下,增加网络深度,获取更多的图像信息,用于分类。
【Inception ResNet V1】
【Inception ResNet V2】
【Inception ResNet V3】
【参考文献】
[1]https://arxiv.org/pdf/1409.4842.pdf
[2]https://arxiv.org/pdf/1502.03167.pdf
[3]https://arxiv.org/pdf/1512.00567.pdf
[4]https://arxiv.org/pdf/1602.07261.pdf
[5]http://baijiahao.baidu.com/s?id=1601882944953788623&wfr=spider&for=pc