卷积神经网络:又称CNN,主要应用于计算机视觉领域,是解决图像分类,图像检索,物体检测和语义分割的主流模型。
核心:对像素阵列进行特征的提取。
卷积核
提取图像中无论如何变换,始终保持一致的局部特征区间
卷积
卷积核在图像上滑动,取与卷积核大小相等的区域,一一相乘然后相加,最后取一个均值,该值就是卷积核提取的特征。(几个卷积核就会得到几个卷积层)
所有特征组成长和宽变小的矩阵,厚度增加–>得到feature map
卷积的三种模式:
- full mode: 从filter和image刚相交开始做卷积;
- same mode: 当filter的中心(K)与image的边角重合时,开始做卷积运算;
- valid mode: 当filter全部在image里面的时候,进行卷积运算.
Normalization
激活函数:用ReLu函数=max(0,x),将负值转化为0,方便运算
池化(pooling),
又称下采样;
功能:对数据进行缩小,放大主要特征,忽略一些偏差;
分为:max pooling(取最大值)和average pooling(取平均值)
卷积神经网络
通过卷积,ReLu,pooling,不断重复操作,得到feature map,排成一列,接到全连接层,形成卷积神经网络。
基本单位:卷积层(识别图像中的空间模式,如局部)+池化层