【经典神经网络架构解析篇】【5】Inception网络详解：模型结构解析、创新点、代码实现

本文链接：https://blog.csdn.net/qq_42589613/article/details/145117042

《------往期经典推荐------》

项目名称	项目名称
1.【人脸识别与管理系统开发】	2.【车牌识别与自动收费管理系统开发】
3.【手势识别系统开发】	4.【人脸面部活体检测系统开发】
5.【图片风格快速迁移软件开发】	6.【人脸表表情识别系统】
7.【YOLOv8多目标识别与自动标注软件开发】	8.【基于YOLOv8深度学习的行人跌倒检测系统】
9.【基于YOLOv8深度学习的PCB板缺陷检测系统】	10.【基于YOLOv8深度学习的生活垃圾分类目标检测系统】
11.【基于YOLOv8深度学习的安全帽目标检测系统】	12.【基于YOLOv8深度学习的120种犬类检测与识别系统】
13.【基于YOLOv8深度学习的路面坑洞检测系统】	14.【基于YOLOv8深度学习的火焰烟雾检测系统】
15.【基于YOLOv8深度学习的钢材表面缺陷检测系统】	16.【基于YOLOv8深度学习的舰船目标分类检测系统】
17.【基于YOLOv8深度学习的西红柿成熟度检测系统】	18.【基于YOLOv8深度学习的血细胞检测与计数系统】
19.【基于YOLOv8深度学习的吸烟/抽烟行为检测系统】	20.【基于YOLOv8深度学习的水稻害虫检测与识别系统】
21.【基于YOLOv8深度学习的高精度车辆行人检测与计数系统】	22.【基于YOLOv8深度学习的路面标志线检测与识别系统】
23.【基于YOLOv8深度学习的智能小麦害虫检测识别系统】	24.【基于YOLOv8深度学习的智能玉米害虫检测识别系统】
25.【基于YOLOv8深度学习的200种鸟类智能检测与识别系统】	26.【基于YOLOv8深度学习的45种交通标志智能检测与识别系统】
27.【基于YOLOv8深度学习的人脸面部表情识别系统】	28.【基于YOLOv8深度学习的苹果叶片病害智能诊断系统】
29.【基于YOLOv8深度学习的智能肺炎诊断系统】	30.【基于YOLOv8深度学习的葡萄簇目标检测系统】
31.【基于YOLOv8深度学习的100种中草药智能识别系统】	32.【基于YOLOv8深度学习的102种花卉智能识别系统】
33.【基于YOLOv8深度学习的100种蝴蝶智能识别系统】	34.【基于YOLOv8深度学习的水稻叶片病害智能诊断系统】
35.【基于YOLOv8与ByteTrack的车辆行人多目标检测与追踪系统】	36.【基于YOLOv8深度学习的智能草莓病害检测与分割系统】
37.【基于YOLOv8深度学习的复杂场景下船舶目标检测系统】	38.【基于YOLOv8深度学习的农作物幼苗与杂草检测系统】
39.【基于YOLOv8深度学习的智能道路裂缝检测与分析系统】	40.【基于YOLOv8深度学习的葡萄病害智能诊断与防治系统】
41.【基于YOLOv8深度学习的遥感地理空间物体检测系统】	42.【基于YOLOv8深度学习的无人机视角地面物体检测系统】
43.【基于YOLOv8深度学习的木薯病害智能诊断与防治系统】	44.【基于YOLOv8深度学习的野外火焰烟雾检测系统】
45.【基于YOLOv8深度学习的脑肿瘤智能检测系统】	46.【基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统】
47.【基于YOLOv8深度学习的橙子病害智能诊断与防治系统】	48.【基于深度学习的车辆检测追踪与流量计数系统】
49.【基于深度学习的行人检测追踪与双向流量计数系统】	50.【基于深度学习的反光衣检测与预警系统】
51.【基于深度学习的危险区域人员闯入检测与报警系统】	52.【基于深度学习的高密度人脸智能检测与统计系统】
53.【基于深度学习的CT扫描图像肾结石智能检测系统】	54.【基于深度学习的水果智能检测系统】
55.【基于深度学习的水果质量好坏智能检测系统】	56.【基于深度学习的蔬菜目标检测与识别系统】
57.【基于深度学习的非机动车驾驶员头盔检测系统】	58.【太基于深度学习的阳能电池板检测与分析系统】
59.【基于深度学习的工业螺栓螺母检测】	60.【基于深度学习的金属焊缝缺陷检测系统】
61.【基于深度学习的链条缺陷检测与识别系统】	62.【基于深度学习的交通信号灯检测识别】
63.【基于深度学习的草莓成熟度检测与识别系统】	64.【基于深度学习的水下海生物检测识别系统】
65.【基于深度学习的道路交通事故检测识别系统】	66.【基于深度学习的安检X光危险品检测与识别系统】
67.【基于深度学习的农作物类别检测与识别系统】	68.【基于深度学习的危险驾驶行为检测识别系统】
69.【基于深度学习的维修工具检测识别系统】	70.【基于深度学习的维修工具检测识别系统】
71.【基于深度学习的建筑墙面损伤检测系统】	72.【基于深度学习的煤矿传送带异物检测系统】
73.【基于深度学习的老鼠智能检测系统】

二、机器学习实战专栏【链接】，已更新31期，欢迎关注，持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】，持续更新中~~
六、YOLO性能对比专栏【链接】，持续更新中~

《------正文------》

深度学习中卷积发展
不同卷积大小优缺点
Inception模块
为什么不使用池化而不是1x 1卷积来减少参数数量
1x1卷积如何帮助减少参数，以及它在inception块中的作用
- 图a的参数计算
- 图B的参数计算
为什么要使用Inception Blocks？
Inception网络及其不同版本
总结

深度学习中卷积发展

在神经网络模型的研究早期，研究人员面临着一个大问题：哪些卷积大小最适合不同的数据集？
如：LeNet使用了5x5卷积，AlexNet尝试了3x3、5x5和11x11，VGG尝试了3x3和5x5的混合。Inception就是在此种情况下诞生，它尝试使用不同的卷积大小组合在一起，用于捕捉不同尺度的图像特征。

不同卷积大小优缺点

更大的卷积（例如，5x5）：
优点：非常有表现力，可以捕捉更多的模式。
缺点：需要很多参数，速度慢，需要更多内存。
较小的卷积（例如，1x1）：
优点：速度快,节约内存。
缺点：可能无法捕捉足够的模式。

Inception模块

深度学习科学家认为，为什么只选择一个卷积大小？
受此启发，Inception模块诞生了，并在Google LeNet论文中引入。该模块使用1x1，3x3和5x5卷积，而不是选择一个卷积大小，将它们堆叠在一起。这种方法允许模型在不同的尺度上“思考”，捕捉小的和大的模式。

为什么不使用池化而不是1x 1卷积来减少参数数量

如果我们执行最大池化，图像大小将减小，而通道数量将保持不变。然而，当我们执行1x1卷积时，它在减少通道数量的同时保持图像大小稳定。

1x1卷积如何帮助减少参数，以及它在inception块中的作用

在其原生形式中，Inception模块由具有不同过滤器大小的多个并行卷积组成。然而，这种结构可能会很快变得计算昂贵（图2）。a）。为了克服这个问题，在具有更大（3x3，5x5等）的卷积层之前添加1x1卷积层。这些1x1层减少了通道数量，降低了成本。

现在，为了了解这些1x1卷积实际上如何帮助降低计算成本，让我们计算图a和图B中的参数数量

我们用来计算卷积后输出图像形状的公式

图a的参数计算

图B的参数计算

因此，我们在起始块中使用1x1卷积以减少参数

对图像应用1x 1卷积时，只要满足以下条件，输出图像的大小将保持与输入图像相同：

步幅= 1

内核在整个图像中一次移动一个像素。
这确保了输入中的每个像素都对输出有贡献。

填充= 0

没有额外的像素被添加到输入图像。

无合并

不执行最大池化或下采样等操作。

为什么要使用Inception Blocks？

有效使用计算：

它不是猜测给定数据集的最佳卷积大小，而是组合多个滤波器大小。

简化：

1x1卷积减少了参数的数量和计算成本。
在应用更大的卷积（如3x3或5x5）之前，使用1x1卷积来减少通道的数量（降维）。这减少了参数的数量，降低了计算成本，使网络比没有降维的简单并行卷积更有效。

适应性：

可应用于各种数据集和图像大小。

保存空间信息：

填充确保输入和输出尺寸匹配。

Inception网络及其不同版本

Inception V1
在这里插入图片描述

Inception V2

Inception V2做了一个改进是使用3X3的卷积代替5X5的卷积核，实验证明这样并不影响结果，但是却减少了参数量，假设输入和输出通道数都是C，那么5X5的卷积核参数量为25C^{2,但是两个3*3的卷积核参数量为18C}2，同时因为使用两个33，使得网络层次加深，增加了非线性，提高了模型的表达能力。

同时Inception V2 引入了BN层（Batch Normalization层），通过对每个小批量数据进行归一化处理，加速训练过程，减少梯度消失和梯度爆炸问题，提高模型的泛化能力和鲁棒性，并允许使用更高的学习率。

在这里插入图片描述

Inception V3

Inception V3使用两个1Xn和nX1的卷积核取代nn的卷积核。这样做，相比把55用两个3*3代替更加参数量少，加速了网络的变化。同时增加了一层非线性扩展模型表达能力。论文解释说，这种非对称的卷积结构拆分，其结果比对称地拆为几个相同的小卷积核效果更明显，可以处理更多、更丰富的空间特征，增加特征多样性。

在这里插入图片描述

Inception V4

使用了不同的 Inception Block，然后堆叠在一起组成完整的网络结构，同时引入残差连接，融合残差神经网络的优点。

论文中网络结构图如下：

在这里插入图片描述

总结

Inception网络主要解决的问题是深度神经网络中的计算复杂度和信息丢失问题。通过引入Inception模块，Inception网络能够在不增加计算复杂度的前提下，有效地提取多尺度特征，从而提高模型的性能和准确性。Inception模块通过不同尺寸的卷积核和池化操作，对输入数据进行多尺度特征提取，避免了传统卷积神经网络中信息丢失的问题。此外，Inception网络还采用了1x1卷积来降低输入数据的维度，进一步减少计算量。因此，Inception网络在图像分类、目标检测等任务中表现出色，成为深度学习领域的一个重要里程碑。

在这里插入图片描述