特征提取
Hog 特征提取
Hog是方向梯度直方图,是一种特征描述符。该技术统计图像局部区域中梯度方向的出现次数。
HOG描述符关注对象的结构或形状。它比任何边缘描述符都好,因为它使用梯度的大小和角度来计算特征。对于图像区域,它使用梯度的大小和方向生成直方图。
其具体计算和原理可以参考这篇文章
SIFT特征提取
SIFT (Scale-invariant feature transform), 尺度不变特征转换,是一种图像局部特征提取算法,它通过在不同的尺度空间中寻找极值点(特征点,关键点)的精确定位和主方向,构建关键点描述符来提取特征。SIFT提取的关键点具有尺度不变性、旋转不变性,而且不会因光照、仿射变换和噪音等因素而干扰。
SIFT所查找到的关键点是一些十分突出、不会因光照、仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。
其具体计算和原理可以参考这个视频
它的特征输出一般包含(x,y,scale,main_diraction),它的描述器分别表示每一个特征,一般会出128个特征
SURF特征提取
SURF 特征,它的全称为加速稳健特征( Speeded Up Robust Feature ),它不仅是尺度不变特征,而且是具有较高计算效率的特征。
surf中,也是在特征点周围取一个正方形框,框的边长为20s(s是所检测到该特征点所在的尺度)。该框带方向,方向当然就是第4步检测出来的主方向了。然后把该框分为16个子区域,每个子区域统计25个像素的水平方向和垂直方向的haar小波特征,这里的水平和垂直方向都是相对主方向而言的。该haar小波特征为水平方向值之和,水平方向绝对值之和,垂直方向之和,垂直方向绝对值之和
其具体实现和原理可以参考这篇文章和这篇文章
Bag of Words特征提取
BoW起始可以理解为一种直方图统计,开始是用于NLP和信息检索中的一种简单的文档表示方法。BoW也只是统计频率信息,并没有序列信息。BoW是选择words字典,然后统计字典中每个单词出现的次数。
只不过在图像中,我们抽出的不再是一个个word,而是图像的关键特征Featur(通常可以是SIFT检测出来的特征)。
具体的算法和实现可以参考这篇文章