【图像分类】GoogLeNet详解

前言

在2014年的图像识别比赛中,由Google团体提出的GooLeNet网络结构大放异彩,字母的大写L为了纪念LeNet,GooLeNet吸收了NiN中串联的思想,其论文重点是解决了什么样大的卷积核最合适的问题。在GooLeNet中,基本的卷积块被称为 I n c e p t i o n Inception Inception 块,这可能来源电《盗梦空间》( I n c e p t i o n Inception Inception )中的一句电影台词"We need to go deeper"(我们需要走得更深)。

网络结构

下图为为GooLeNet的框架图
在这里插入图片描述
从图中可以发现GoogLeNet主要由9个 I n c e p t i o n Inception Inception 块、全局平均汇聚层、辅助分类器构成。

Inception块

在这里插入图片描述
上面为Inception块示意图,(a)为普通的Inception块,(b)为带有1×1卷积核的Inception块
在深度学习中,局部的信息通常有较小的卷积核提取,范围比较大的信息由大的卷积核提取,越到后面,其特征会越抽象,但是当串联两个卷积核时,它们的滤波器数目的任何统一增加都会引起计算量平方式的增加。如果增加的能力使用时效率低下(例如,如果大多数权重结束时接近于0),那么会浪费大量的计算能力。为了解决相关问题,Inception块应运而生。

在(b)中,有4条并行的路线,其中前面三条使用了1×1卷积核主要是为了降低模型的复杂度,即减少参数,第4条使用3×3最大汇聚层。最后把所有的通道进行合并,需要注意的是这4条路线要保持相同的shape最后才能在通道维度进行合并。

验证使用1×1卷积核是否能降低模型复杂度
在这里插入图片描述
当不使用1×1卷积核时,可学习参数: 512 × 32 × 5 × 5 = 409600 512×32×5×5=409600 512×32×5×5=409600
当使用1×1卷积核时,可学习参数: 512 × 24 × 1 × 1 + 24 × 32 × 5 × 5 = 31488 512×24×1×1+24×32×5×5=31488 512×24×1×1+24×32×5×5=31488
可知使用1×1卷积核能够大幅度降低参数。

辅助分类器

给定深度相对较大的网络,有效传播梯度反向通过所有层的能力是一个问题。在这个任务上,更浅网络的强大性能表明网络中部层产生的特征应该是非常有识别力的。通过将辅助分类器添加到这些中间层,可以期望较低阶段分类器的判别力。这被认为是在提供正则化的同时克服梯度消失问题。这些分类器采用较小卷积网络的形式,放置在Inception (4a)和Inception (4b)模块的输出之上。在训练期间,它们的损失以折扣权重(辅助分类器损失的权重是0.3)加到网络的整个损失上。在推断时,这些辅助网络被丢弃。后面的控制实验表明辅助网络的影响相对较小(约0.5),只需要其中一个就能取得同样的效果。
辅助分类器的网络结构如1图黄色方框

· 一个滤波器大小5×5,步长为3的平均池化层,导致(4a)阶段的输出为4×4×512,(4d)的输出为4×4×528。
· 具有128个滤波器的1×1卷积,用于降维和修正线性激活。
· 一个全连接层,具有1024个单元和修正线性激活。
· 丢弃70%输出的丢弃层。
· 使用带有softmax损失的线性层作为分类器(作为主分类器预测同样的1000类,但在推断时移除)。

参考资料

1.https://www.bilibili.com/video/BV1z7411T7ie/?spm_id_from=333.788
2.GoogleNet论文

  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
### 回答1: Matlab是一种非常方便的图像处理工具,但对于初学者而言,可能会发现理解和使用Matlab图像处理源文件较为困难。下面将详细说明Matlab图像处理实例的源文件,以帮助读者更好地理解和应用。 Matlab图像处理实例源文件一般包括以下几个部分: 1.读取图像:当进行图像处理时,首先要将图像读入Matlab中。通常使用imread()函数来读取图像,其返回结果为一个矩阵,即对应于图像的像素矩阵。 2.图像预处理:读取图像后,需要对图像进行初步的预处理。例如,可以使用imadjust()函数来调整图像的对比度和亮度等参数,使图像更加清晰。 3.图像处理:真正的图像处理是在这一步进行的。Matlab提供了丰富的图像处理函数,例如imfilter()、imrotate()、imresize()等,可以实现滤波、旋转、缩放等操作。 4.图像分割:图像分割是将图像分成若干个部分,以便进行更加精细的处理。通常使用imfindcircles()、imfindobj()等函数进行图像分割。 5.图像显示:最后一步是将处理好的图像显示出来。可以使用imshow()函数将图像显示到Matlab的界面上,方便用户进行查看和分析。 总之,Matlab图像处理实例源文件非常重要,它包含对图像的基本操作和处理方法,有了源文件,我们可以更好地理解和应用图像处理技术,进一步提高图像处理的效率和精度。 ### 回答2: MATLAB图像处理实例详解源文件包含了一系列用于图像处理的MATLAB代码及相关说明。这些代码的主要目的是帮助用户更好地理解和使用MATLAB进行图像处理。 这些源文件主要以函数的形式呈现,用户可以使用这些函数来实现一些特定的图像处理任务,比如图像滤波、图像增强、图像分割等等。每个函数文件中都有详细的注释和说明,用户可以通过阅读这些注释来了解函数的具体使用方法以及其参数的意义和用法。 除了函数文件外,源文件还包括了一些图像示例,用户可以通过这些示例来了解如何使用函数来处理图像。这些示例都有详细的说明和注释,用户可以根据自己的需要进行修改和调整。 此外,源文件还包括了一些MATLAB工具箱的例子以及对各种图像文件格式的读取和写入代码。这些内容可以帮助用户更好地了解MATLAB在处理不同类型的图像时需要注意的问题和技巧。 总的来说,MATLAB图像处理实例详解源文件是一个很好的学习和掌握MATLAB图像处理技术的资源,用户可以通过阅读和实践这些代码来更好地掌握MATLAB在图像处理方面的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白哒哒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值