经典卷积网络之GoogLeNet

不老使者

于 2024-07-15 17:28:39 发布

阅读量109

点赞数 3

分类专栏：经典卷积网络文章标签：网络深度学习人工智能

本文链接：https://blog.csdn.net/airarmy/article/details/140444598

版权

4 篇文章 0 订阅

订阅专栏

GoogLeNet（也称为GoogleNet或Inception v1）是谷歌工程师设计的一种深度神经网络结构，它在2014年的ImageNet图像识别挑战赛中取得了冠军。

深度和宽度：
- GoogLeNet通过引入名为Inception的核心子网络结构，使得网络在深度和宽度上都有显著的提升。这种设计增强了网络的预测能力，能够在多个尺度上提取特征。
Inception模块：
- Inception模块是GoogLeNet的关键组成部分，它采用并行结构，将不同大小的卷积核（1x1、3x3、5x5）和池化操作（通常是3x3的最大池化）的结果进行拼接，从而捕捉不同尺度的特征。这种设计既增加了网络的宽度，又提高了特征提取的效率。
1x1卷积核的作用：
- 在Inception模块中，1x1卷积核主要用于降维和跨通道特征变换，以减少计算量和参数数量。通过在3x3和5x5卷积之前使用1x1卷积核，可以显著减少后续卷积层的输入通道数，从而降低整体计算复杂度。
全局平均池化：
- GoogLeNet在网络的最后采用了全局平均池化（Global Average Pooling, GAP）层，取代了传统的全连接层。GAP层对每个特征图进行平均操作，生成一个单一的数值作为该特征图的输出。这样做不仅减少了参数数量，还提高了模型的泛化能力。
辅助分类器：
- GoogLeNet在网络中加入了两个辅助分类器，分别位于网络的中间部分。这些辅助分类器在训练过程中与主分类器共同学习，有助于缓解梯度消失问题，并提高模型的训练稳定性。在测试时，这些辅助分类器的输出会被忽略。

模块化设计：
- GoogLeNet采用了模块化的设计思想，Inception模块作为基本的构建块，可以方便地进行堆叠和组合，形成更深的网络结构。
参数效率高：
- 尽管GoogLeNet的网络结构相对复杂，但由于Inception模块的参数共享和1x1卷积核的降维作用，使得整个网络的参数数量相对较少。这使得GoogLeNet在保持高性能的同时，也具有较高的计算效率。
多尺度特征提取：
- 通过并行使用不同大小的卷积核和池化操作，Inception模块能够提取不同尺度的特征。这种多尺度特征提取的能力使得GoogLeNet在处理复杂图像时更具优势。