为什么在行人检测中,HOG特征比Haar特征更精确?

原文链接

问题

我最近读了这篇文章,作者说,在人体检测应用中,Haar特征没有HOG精确,为什么呢?

回答1

计算机视觉中各种特征描述符的设计和实现,都是在不断的试错下进行的,对内部的机理并没有太多的考虑。

方向HOG这篇经典论文是专门为了行人检测做的方法,Navneet和Dalal做了很多很苦逼的工作,在各种空间,各种维度下,不断的实验,发现了一个重要的认识:对比度归一化特别重要,这让HOG的效果超过SIFT(SIFT也是基于方向梯度直方图来做的!)。由于设计的HOG在某种程度上,对于人体检测这个任务,已经过拟合了(译者加:overfitting,总觉得理解为机器学习里面的过拟合,不太恰当,应该是指很好的满足了需求,还有剩余),所以意料之中的是,在人体检测这个任务中,它的性能会比其他的好。(除非那些根据训练数据学习的特征,这些学习的方法或多或少受HOG的方法影响,例如CNN训练出的特征。)

我最近读到的一种观点,但说实话并没有真正地理解,是说,Haar特征(或者其他小波)是一种纹理特征,相比于SIFT/HOG来说。它们擅长检测相似的纹理,但是缺乏方向信息,这就导致了在目标识别中并不最有效,因为边缘的方向很重要。我目前还没有看到通过实验评估相关方法的文章。

(2015.9.8)

回答2


(译者加:回答者在CV领域干了6年多)

这个问题取决于,行人最重要的特征是什么。最重要的特征可能不止一个,但定义一个典型行人的特征,需要包括轮廓,腿和头的形状。所以,那些能够精确捕捉或者描述人体轮廓的方法,就会最终在人体检测问题上,得到最好的结果。

HOG比Haar更好地描述行人,或者目标的轮廓/外形。换一种说法,简单的类Haar比HOG更能检测待测区域是不是比周围更亮或者更暗。简而言之,HOG适合描述外形(shape),Haar适合描述阴影(shading)。

这也就是为什么Haar特征在检测正脸效果好,而检测侧脸效果差的原因。正脸有诸如鼻梁比周围更亮等等特征,而侧脸重要的特征在于它的轮廓和外形,所以HOG适合做侧脸检测。

HOG和Haar是互补的,所以如果结合一起使用,会得到更好的效果。HOG擅长描述物体外形,所以适合行人检测;Haar擅长描述物体阴影,所以适合正脸检测。

希望能帮到你。

(2015.9.9)

总结

计算机视觉里的每一种trick,一定有它的motivation。motivation就决定了这个方法能够解决的问题域的大小。了解motivation,有时候(或者,任何时候),比知道trick具体怎么实施,更加重要。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值