为什么在行人检测中，HOG特征比Haar特征更精确？

最新推荐文章于 2024-01-08 12:02:42 发布

DuinoDu

最新推荐文章于 2024-01-08 12:02:42 发布

阅读量6.6k

点赞数 1

分类专栏：计算机视觉的各种tricks 英文博客翻译文章标签： hog 计算机视觉

英文博客翻译同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

计算机视觉的各种tricks

2 篇文章 0 订阅

订阅专栏

原文链接

问题

我最近读了这篇文章，作者说，在人体检测应用中，Haar特征没有HOG精确，为什么呢？

回答1

计算机视觉中各种特征描述符的设计和实现，都是在不断的试错下进行的，对内部的机理并没有太多的考虑。

方向HOG这篇经典论文是专门为了行人检测做的方法，Navneet和Dalal做了很多很苦逼的工作，在各种空间，各种维度下，不断的实验，发现了一个重要的认识：对比度归一化特别重要，这让HOG的效果超过SIFT（SIFT也是基于方向梯度直方图来做的！）。由于设计的HOG在某种程度上，对于人体检测这个任务，已经过拟合了（译者加：overfitting，总觉得理解为机器学习里面的过拟合，不太恰当，应该是指很好的满足了需求，还有剩余），所以意料之中的是，在人体检测这个任务中，它的性能会比其他的好。（除非那些根据训练数据学习的特征，这些学习的方法或多或少受HOG的方法影响，例如CNN训练出的特征。）

我最近读到的一种观点，但说实话并没有真正地理解，是说，Haar特征（或者其他小波）是一种纹理特征，相比于SIFT/HOG来说。它们擅长检测相似的纹理，但是缺乏方向信息，这就导致了在目标识别中并不最有效，因为边缘的方向很重要。我目前还没有看到通过实验评估相关方法的文章。

（2015.9.8）