【22-23 春学期】AI作业8-卷积2

文章介绍了卷积神经网络中的核心概念,包括步长和填充在控制输出大小和形状中的作用,感受野如何影响神经元对输入数据的理解,以及局部感知和权值共享如何帮助减少过拟合和提升效率。此外,还讨论了池化操作的目的和特征层次,从低级的边缘和纹理到高级的物体类别和场景理解。
摘要由CSDN通过智能技术生成

1.步长、填充

步长和填充是卷积操作中常用的两个超参数,用于控制卷积的输出大小和形状。

步长是指卷积核在对输入数据进行卷积操作时,每次沿着输入数据的某个方向跳过的步长数。比如,步长为1表示卷积核在对输入数据进行卷积时,每次移动一个单位长度;步长为2表示每次移动两个单位长度,以此类推。

填充是指在输入数据的边缘周围添加一定数量的虚拟像素,以便扩大输入数据的大小,从而使得卷积操作的输出与输入数据大小相同。填充可以在卷积操作中保留输入数据边缘的信息,减少卷积操作对输入数据边缘像素的影响。

2.感受野

感受野是指神经网络中每个神经元对输入数据的感受区域大小。在卷积神经网络中,每个卷积层的神经元只连接上一层神经元的一部分,而感受野的大小就代表了这部分的大小。例如,对于一个卷积层的神经元来说,如果它的感受野大小为5*5,那么它只连接了上一层神经元中一个5*5的区域。

感受野的大小与神经网络的结构相关,通常由卷积核的大小、步长、池化层等参数来决定。在神经网络的前面层,每个神经元的感受野相对较小,只能感受到局部的图像信息,例如边缘、角落等。随着网络层数的增加,每个神经元的感受野也会逐渐扩大,能够感受到更大范围的图像信息,例如纹理、物体部件等。感受野的大小可以影响神经网络的性能,较大的感受野可以帮助网络更好地理解图像中的上下文信息,提高模型的准确率。

3.局部感知、权值共享

局部感知指的是卷积操作中,卷积核只关注输入图像的一小块区域(通常是3*3或5*5的矩阵),而不是整个输入图像。这样做的好处是可以捕捉到输入图像中的局部特征,例如边缘、纹理等。通过不断使用卷积操作,网络可以逐渐学习到输入图像的更高级别的特征,例如物体的形状、轮廓等。

权值共享指的是卷积神经网络中,每个卷积核的权重值在不同的位置上是相同的。例如在处理图像时,一个卷积核可以被用来检测图像中的边缘,而这个卷积核的权重值在检测不同位置的边缘时是相同的。这种共享权重的方式可以极大地减少网络的参数量,从而降低过拟合的风险,并提高网络的训练效率。

4.池化(子采样、降采样、汇聚)

池化是一种常用的神经网络操作,可以通过将输入张量分块并对每块取池化(汇聚)值来减小张量的尺寸。池化操作常用于降低特征图的尺寸和减少计算量,同时也可以提高模型的鲁棒性。

5.低级特征、中级特征、高级特征

在深度学习中,卷积神经网络通常可以分为多个层,每个层会学习一些特定层次的特征。这些特征可以被分为三个不同的层次,即低级特征、中级特征和高级特征。

低级特征通常指一些基本的特征,例如边缘、角落、纹理等。这些特征通常由卷积层中的较小的卷积核学习得到,因为较小的卷积核更容易捕捉到图像的细节特征。低级特征可以被认为是一些局部的特征,它们并没有包含太多的语义信息。

中级特征通常由一些稍大一些的卷积核学习得到,例如 3x3 或 5x5 的卷积核。这些特征通常可以捕捉到一些更高级别的语义信息,例如简单的物体形状、纹理组合等。中级特征可以被认为是一些更加抽象的特征。

高级特征通常由卷积层中较大的卷积核或全连接层学习得到,它们可以表示更加抽象和语义化的特征,例如物体的类别、空间关系、场景等。高级特征通常是从低级特征和中级特征中组合而成的,因此它们通常涵盖了更多的语义信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值