CNN伟大之处在于通过感受野和权值共享减少了神经网络需要训练的参数的个数。
图像的空间联系是局部的,就像人是通过一个局部的感受野去感受外界图像一样,每一个神经元都不需要对全局图像做感受,每个神经元只感受局部的图像区域,然后在更高层,将这些感受不同局部的神经元综合起来就可以得到全局的信息了。这样,就可以减少连接的数目,也就是减少神经网络需要训练的权值参数的个数了。
feature map
特征映射,是输入图像和卷积核卷积后生成的图像特征。每个feature map通过1个卷积核提取输入的1个特征。我们需要多个卷积核来提取输入的多个特征。边长的计算公式是:
output_h =(originalSize_h+padding*2-kernelSize_h)/stride +1
CNN的核心思想:将局部感受野、权值共享以及下采样这3种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。
1.结构
- 若干卷积层(+RELU激活函数)
- 若干池化层(无激活函数)
- 全连接层(+sigmoid/tanh激活函数,最后一层是softmax输出层)