引入
卷积神经网络(CNN)主要应用于计算机视觉,用于识别图像。它总共可以分成四个结构
输入层 ,卷积层 ,池化层 ,全连接层 。
详细介绍CNN
1)输入层
与普通神经网络类似,但普通神经网络输入可能是一个N维向量,卷积神经网络输入通常是二维或三维的矩阵。例如,若传入的是某图像的灰度图,那么输入层就是一个m*n*1的三维矩阵,每一个输入都代表对应位置的灰度值;如果传入的是一个RGB三通道图像,那么输入层就是一个m*n*3的三维矩阵。
2)卷积层(核心)
卷积层工作原理:
我们先考虑灰度图:
比如我们想识别一个图像是X还是O,但要求不管图像是否出现旋转、剪切、增厚,我们都能够识别出它,应该怎么做呢?
计算机的方法是选取X的几个特征,也就是卷积核,再在被识别的图像中尝试提取出这些特征。