本文以图像分类为例简要介绍卷积神经网络的基本结构。
卷积
过滤器(核):
过滤器是我们用来卷积的工具。对于一张图片,我们可以利用过滤器来抓取图片的某些特征。
一个过滤器是一个 f * f 的矩阵, 其中的每一个元素都是可训练的参数。
我们假设现在有一个6 * 6的灰度图,3 * 3的过滤器,那么卷积的过程如下:
1.将过滤器覆盖在图片的左上角,计算9个位置对应元素的乘积并加和作为一个输出
2.将过滤器向右平移一格,再次计算乘积加和作为第二个输出。
3.无法向右平移时向下平移一行并挪到最左边开头,重复上述步骤。
这样一来我们能够得到一个4*4的输出,这就是卷积。
Padding
通过上面的例子我们会发现,卷积时边缘元素的利用较少而中间元素的利用较多。同时可以发现,经过卷积,我们的图片尺寸会有所缩小。
为了解决这两个问题,我们可以对原图的边缘进行扩充,这个过程叫做padding。(往往扩充部分置为0)