步长(stride):
用来描述卷积核移动的步长。通常来说,卷积核的步长为1,也就是卷积核每次都滑动一个像素单位
填充(padding):
指在输入数据的边缘处添加一定数量的虚拟数据,使得卷积核可以在边缘处进行卷积操作。填充可以控制输出的特征图尺寸,并且可以避免信息丢失
感受野:
卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小。
局部感知:
即网络部分连通,每个神经元只与上一层的部分神经元相连,只感知局部,而不是整幅图像
权值共享:
从一个局部区域学习到的信息,应用到图像的其它地方去。即用一个相同的卷积核去卷积整幅图像,相当于对图像做一个全图滤波。一个卷积核对应的特征比如是边缘,那么用该卷积核去对图像做全图滤波,即是将图像各个位置的边缘都滤出来。(帮助实现不变性)。不同的特征靠多个不同的卷积核实现。
池化操作:
是CNN中非常常见的一种操作,池化操作通常也叫做子采样(Subsampling)或降采样(Downsampling),在构建卷积神经网络时,往往会用在卷积层之后,通过池化来降低卷积层输出的特征维度,有效减少网络参数的同时还可以防止过拟合现象。
低级特征:
低级特征为从图像中直接提取出来的特征,例如强度、时域强度、梯度等。低级特征通常以描述符的形式表示,描述符包含一组没有明确语义含义/知识的可视化数据线索,主要包括局部二值模式(LBP),光流,梯度,以及它们各自的变体。
中级特征:
当前存在的主要方法利用面部整体或者不同区域的时间和空间特征进行分类。然而,低级特征对于表达持续时间短、强度低、有噪声和头部姿态变化的微弱运动是不充分的。因此,中级特征来把低级特征整合为有更强描述能力的更丰富的特征。中级特征转换低级特征为用于分类的图像表征,增加权重来给局部特征以明确的含义与知识。这类提取的描述符将以图像级信息的视觉词内容来表示,而不是简单的没有明确含义的视觉线索。最常见的中层技术是在情感识别中常用的词袋模型bag-of-words (BoW)。
高级特征:
高级表示可以定义为一组人类可解释的语义数据,其中高级特性是几个低级特性的组合。例如在面部认证中,一系列信息作为高级特征,例如年龄、性别、肤色等,这些语义信息可以用低级特征如颜色或者纹理等信息中提取。低级特征又称为手工特征,从像素中提取,送入分类器中用于认证。另外,高级方法倾向于特征学习,也就是从原始输入图像中学习和理解。