参考:cs231n
这个系列写的是我对cs231n的一些翻译和理解
————————————————————————————————————————————
input of CNN
在刚接触CNN的时候,我是看到的几乎所有的教程都是已识别灰度图像入门的,灰度图像在计算机中的表示是一个二维的矩阵,每个(x. y)对应一个值在[0, 255]之间的数字。但是彩色图像应该怎么作为输入呢?
举个例子:
灰色图像:
[101, 102, 103...
111, 112, 113...]
彩色图像:
[[101, 102, 103], [104, 105, 106]...
[111, 112, 113], [114, 115, 116]...]
上面这张图是cs231n里给的可视化图片,简单说下图片下面的英文:神经卷积网络的每层通过一个神经元将一个3D输入卷转化为3D输出卷。在这个例子里,红色层(最左边那一层)储存输入图片,所以他的宽度和高度是图片的尺寸,深度是3(RGB三种颜色)。
也就是说我们输入的彩色图片是一个W*H*3的矩阵,灰色图片是W*H*1的矩阵。
Convolutional Layer
上面就是卷积层的输入,对于一个彩色图片来说,卷积层的输入是3个feature map,