之前的文章行人计数、计次提到HOG特征这个概念,这两天看了一下原版的论文,了解了一下HOG特征的原理,并根据自己的理解将这个方法的流程写了下来,如果有不对的地方欢迎指正。
HOG(Histograms of Oriented Gradients)特征的基本思想:The basic idea is that local object appearance and shape can often be characterized rather well by the distribution of local intensity gradients or edge directions, even without precise knowledge of the corresponding gradient or edge positions.即使不知道(图像间)准确的对齐的梯度或边缘位置,局部目标的外观和形状信息也能通过局部梯度密度或边缘方向来表征。下面是HOG特征的提取过程。参考文献[1]里将HOG特征用作行人检测,其实如果将下面的步骤读完,你会发现HOG不止可以用来检测行人,也可以检测狗、猫等等几乎任何物体,所做的工作只是训练样本的不同,所以HOG特征可以称为object检测方法。
1、色彩归一化(Gamma/Color Normalization)
作者测试了RGB、LAB还有灰度空间内的图像,发现RGB和LAB空间内的测试图像取得的结果基本相同,而灰度空间内的图像识别率又1.5%下降。所以这几种色彩空间的效果大体相同,没必要将RGB转化到LAB或反之。所以这一步的归一化基本可以省略,但是测试图像和训练的图像总得是一个颜色空间的,这点没问题吧。
2、计算梯度值(Gradient Computation)