卷积神经网络的概述
卷积神经网络CNN是一类包含卷积计算且具有深度结构的神经网络,是深度学习的代表算法之一 。在计算机视觉领域具有强大的影响力,是计算机视觉领域核心的算法模型。
图片的存储
计算机视觉中常常处理图片数据,图像在计算机中是一堆按顺序排列的数字,数值为0到255。0表示最暗,255表示最亮。 我们可以把这堆数字用一个长长的向量来表示, 然而用向量表示的话会失去平面结构的信息,为保留该平面结构信息,通常选择矩阵的表示方式。
RGB颜色模型中,因为图片有三个通道,那么每一个矩阵又叫这个图片的一个通道,在计算中使用三个通道来进行表示,在电脑中,一张图片是数字构成的"长方体"。可用 宽, 高, 深来描述,一张图片在电脑中是这样存在的:
三种常见的图像的处理方式:
1均值化(CNN只用去均值):把输入数据各个维度都中心化到0
2归一化:数据幅度归一化到同样的范围
3PCA/白化:用PCA降维,白化是对数据每个特征轴上的幅度归一化
去均值:所有样本求和求平均,然后用所有的样本减去这个均值样本就是去均值。
归一化:对于每个特征而言,范围最好是[-1,1],
PCA/白化:用PCA降维,让每个维度的相关度取消,特征和特征之间是相互独立的。白化,对数据每个特征轴上的幅度归一化
图片数据并不会直接放到神经网络中,而是要进行一系列的处理,这样才能放到神经网络中,我们将这个步骤称为图片数据的预处理操作