Abstract
Inception网络的主要特点是在网络内提高计算资源的利用率。在有限的计算预算下,作者精心设计网络架构来增加网络的深度和宽度。
Introduction
目标检测领域增益来自:
- 更深更大的网络模型
- 深度框架与经典CV的结合,如R-CNN
移动和嵌入计算的需求使得算法的有效性(功耗和内存)日渐重要。
Related Work
从LeNet-5开始,卷积神经网络已经有一个标准的结构——卷积层堆积(有选择性地增加contrast normalization and max-pooling)紧跟着一个或多个全连接层。对于大数据集如ImageNet,最近的趋势是增加层的数目和层的尺寸,同时利用dropout来克服过拟合问题。
尽管担心max-pooling层会导致空间信息的丢失,卷积网络结构如【9】被成功用来定位、目标检测和人的姿态评估。受神经科学里灵长目动物视觉平层模型的灵感激发,Serre【15】等人利用一系列不同尺寸的固定Gabor滤波器来处理多尺度问题,与Inception模型类似。但是和Serre固定两层深度模型不同的是,Inception里所有的filters都是学习的。更进一步讲,Inception层被重复若干次,直至22层深度模型比如GoogLeNet模型。
<