目录
卷积神经网络于1998年由Yann Lecun提出,卷积网络用于处理计算机图像。图像分类是计算机视觉中的一个核心问题。计算机视觉的和兴任务之一时图像识别。
如何来实现图像识别呢?我们会给计算机提供每种类别的图片,让机器自己去学习其中的特征并形成一个算法,这就是机器学习的核心
这些算法以来与数据集,已成为数据驱动的算法
1.三个性质
1.1局部性
检测局部图片中的特征来决定图片的类别
1.2相同性
不同的图片,如果具有相同的特征,虽然这些特征会出现在不同的位置。但是他们的特征还是相同的,我们还是可以通过局部的特征来判断
1.3不变性
对于一张图片,我们进行向下采样(对于一个样值序列间隔几个样值取样一次,这样得到新序列就是原序列的下采样。),那么图片的性质基本保持不变
2.网络的层结构
对于全连接神经网络,在输入层中需要输入图片的每个像素,对于MNIST数据集来说需要28*28个输入神经元。而这些图片还是较小的。对于较大的彩色图片我们不可能使用那么多的神经元来进行处理。
卷积神经网络是一个3D容量的神经元,一个神经元是以三维来排列的:宽度、高度和深度。
卷积神经网络主要有三层结构:卷积层、池化层和全连接层,通过堆叠来形成一个完整的卷积神经网络。
2.1卷积层
卷积层是卷积网络的核心,大多数计算都是在卷积层中进行的。卷积网络的参数是由一系诶可以学习的滤波器集合构成的,每个滤波器在宽度和高度上都比较小,但是深度输入和数据保持一致。当滤波器沿着图像的宽和高滑动时,会生成一个二维的激活图。
每个滤波器会有一整个滤波器的集合,会形成多个激活图