1.前言:
卷积神经网络在计算视觉领域的表现十分出色,与普通的BP神经网络一样,CNN同样由神经元组成。其实卷积神经网络是卷积+神经网络,基本上由三部分组成:卷积层,pooling层,全连接层。
2.CNN:卷积层
卷积是一个信号领域的概念,我们这里提到的卷积是一个图像领域的概念。卷积的操作很是简单就是将一个小矩阵和大矩阵上某一点的邻域(大小与小矩阵相同)的对应位置的加权平均和,将这个和放到新的矩阵去。我们将小矩阵称为卷积核
卷积层实际上是一个特征提取的过程,卷积层由一层可以卷积操作的,卷积核可学习的神经元组成。这些神经元将卷积计算进行完毕之后,将所有的结果放到一起。
比如12个原来的图像是28x28x3,使用5x5x3的神经元,计算后得到了12个结果,这个结果就变成了6x6x12了。
一般来说在卷积层的后边还有一个relu层,用来将卷积后得到的图像结果进行整合,将结果变成线性的。
2.CNN:polling layer:
polling层也叫池化层,其实就是降采样层……,可以是最大值polling,或者是平均值polling
3.CNN:全连接层:
其实就是简单的BP神经网络,和前面介绍的神经网络没有什么区别,最后输出的是分类或者其他的结果。
一般来说,一个卷积神经网络的模型是N个卷积层加池化层,最后接上全连接层。当然不同的层间结构效果不一定会相同。现在比较流行的一些卷积神经网络比如VGGnet,googlenet,resnet,AlexNet都是不同的层间结构。