卷积与卷积核
在泛函分析中,卷积(Convolution)是通过两个函数f和g生成第三个函数的一种数学算子,表征函数f与g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分。(百度)
卷积核就是图像处理时,给定输入图像,输入图像中一个小区域中像素加权平均后成为输出图像中的每个对应像素,其中权值由一个函数定义,这个函数称为卷积核。(百度)
自我理解:卷积核可以被动接收图片输入对RGB值进行加权处理,其还可以主动设置权值,对输入的数值进行选择性处理。在卷积神经网络的较低层,卷积核类似于一个筛子,通过设置权值,可以筛选出来横向、纵向或角度斜等特征向后传递。
卷积核简析
单个卷积核具有三个属性:宽(W)、高(H)、深(C或channel),其中宽和高的值设置较为自由,一般宽高设置的值相等,可选3x3、5x5、7x7等,需注意较大的卷积尺寸可以获得更大的图像感受野,但也会引入大量参数造成模型运行速度降低。卷积核的深度C(channel):卷积核的深度需要与输入的图像或特征图的深度保持一致,这与卷积核的作用机制有关,如初始输入图像尺寸为K x K x 3,则卷积核尺寸必须为S x S x 3,卷积核与输入图像或特征在深度方向上保持一致。
多个卷积核:为了充分提取图像的特征一般会采用较多卷积核对输入的图像或特征图进行处理,卷积核的数量可以设置任意值。一般来说,随着卷积和池化的进行,图像的尺寸不断压缩,为了保证特征不丢失,卷积核的数量需要随图像压缩同步增加。
注:卷积核的深度和卷积核的个数是不同的概念,卷积核的深度是单个卷积核的属性,其数值需与输入的图像或特征图深度保持一致,而卷积核的个数则定义为对输入图像或特征进行处理,需要多少个单个卷积核可以较为充分的提取特征,其数值可以自行定义。
参考
关于卷积核的详细教程,推荐吴恩达老师深度学习课程——卷积神经网络的第一周的内容,链接如下。
卷积核详解.