经典计算机视觉论文笔记——《Robust Real-Time Face Detection》

原创 2016年06月01日 20:40:00

        第一次读这篇传奇之作大概是九年前了,也就是2007年,而那时距论文正式发表(2004年)也已经有四年之久了。现在读来,一些想法,在深度学习大行其道的今天仍然具有借鉴意义,让人敬佩不已。

        VJ人脸检测器应该是历史上第一个成功商业应用的实时人脸检测器。我估计现在相机和手机上的人脸检测算法绝大部分还是VJ或VJ算法的徒子徒孙。OpenCV当年也是凭借VJ算法的集成而一炮走红,到现在还是最主流的计算机视觉算法库。本人在真实环境下亲测,2010年后的许多能在FDDB测评主页上露个脸的开源算法,其实效果都不见得会比VJ算法好多少。

算法创新点
创新点 作用
积分图

加速haar特征计算的巧妙点子。一劳永逸,去掉特征计算中的冗余。

AdaBoost人脸检测器

特征选择+分类器融合。对adaboost的思想进行合理改造,一个haar特征对应一个弱分类器,弱特征组合成强特征,弱分类器组合成强分类器。

级联结构

由粗到精的检测策略,加速的同时又能保证精度。先在前期用快速算法把大量非人脸去掉,平衡后期慢速的更精细分类开销。









一些值得反思的细节

  • AdaBoost算法是1995年提出的,这篇论文正式发表是在2004年。如此经典的boosting思想怎么没早一点被人发扬?
  • 实验环境:384*288分辨率,700MHz Pentium3,15帧每秒。现在主流摄像头分辨率是640*480,但硬件计算能力要远远超越当时,24帧每秒毫无压力。
  • 一幅图像上非人脸窗口占绝大多数,自然会想到先快速把大量非人脸干掉的cascade的策略。
  • Haar特征只是三种特征(左右和上下矩形相减算一种),表达能力有限。但由于多比例伸缩、平移,构成了一个庞大的特征集合,表达能力爆表。
  • 在检测不同大小的人脸时,没有采用金字塔策略,而是直接用不同尺度的人脸检测器在同一幅图像上扫。作者认为生成金字塔太慢。但除了24*24尺度的,其它尺度的检测器的cascade细节几乎没有介绍。不知道是不是我搞错了?
  • 24*24的图像上,全部的Haar特征有160000个!最后cascade选择出来的一共有6060个特征。
  • 积分图的计算也是非常快的,从左上角开始递归计算,没有冗余。
  • AdaBoost算法的目标是拟合训练集。因为单个弱分类器的拟合太差了。但是,如果一个算法本身对训练集拟合的就很好了,比如深度学习,就不能看作是一个弱分类器,不适合用于AdaBoost框架。
  • 在分类器类型一致的情况下,不同的特征就代表了不同的分类器。特征组合和分类器组合就是一回事。
  • AdaBoost的每次迭代,只和前一次的迭代结果有关。
  • cascade共包含38个AdaBoost分类器,复杂度逐渐递增。复杂度的递增是通过采用的样本越来越难分、特征数量越来越多实现的。
  • 检测出有重叠的人脸时,没有用目前主流的IOU去重。毕竟年代太古老了。

借鉴之处

  • cascade的思想。许多检测问题,负类会在样本中占绝大多数比重,可以先在保证正类检测率近100%的情况下,去掉大量负类。再通过更精细的算法继续精准分类。
  • 想想算法中有没有冗余计算之处,并加以优化。
  • AdaBoost的生命力长青。参考迁移学习中的TrAdaBoost。
  • 某些情况下,特征就代表分类器,不需要分得太清。
  • 梯度类型的特征就是牛逼!参考SIFT,HOG,LBP。






版权声明:本文为博主原创文章,未经博主允许不得转载。

10年后再看Robust Real-Time Face Detection(一)

这篇论文是人脸检测上的jingdian
  • a130737
  • a130737
  • 2014年05月30日 19:40
  • 3401

鲁棒的实时人脸检测:Robust Real-Time Face Detection

摘要:本文介绍了一种人脸检测体系,它能够快速处理图像并达到较高的检测率。它具有三个关键性的贡献。第一个贡献就是引入一种叫做“积分图像”的新的图像表示法,它使得应用到我们检测器的特征能够被快速计算。第二...
  • ha000
  • ha000
  • 2016年03月30日 20:05
  • 1721

行人检测论文笔记:Robust Real-Time Face Detection

知识点 傅里叶变换的一个推论: 一个时域下的复杂信号函数可以分解成多个简单信号函数的和,然后对各个子信号函数做傅里叶变换并再次求和,就求出了原信号的傅里叶变换。 卷积定理(Convolution Th...

10年后再看Robust Real-Time Face Detection(二) 之特征讨论

再该篇论文中选择了三种矩形特征(Rectangle features )。
  • a130737
  • a130737
  • 2014年05月31日 19:04
  • 1423

目标检测的图像特征提取之(二)LBP特征

LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäin...
  • whu_zcj
  • whu_zcj
  • 2016年03月02日 10:37
  • 664

哈尔小波变换的原理及其实现(Haar)

Haar小波在图像处理和数字水印等方面应用较多,这里简单的介绍一下哈尔小波的基本原理以及其实现情况。   一、Haar小波的基本原理         数学理论方面的东西我也不是很熟悉,这边主要用...

【计算机视觉】【神经网络与深度学习】论文阅读笔记:You Only Look Once: Unified, Real-Time Object Detection

尊重原创,转载请注明:http://blog.csdn.net/tangwei2014 这是继RCNN,fast-RCNN 和 faster-RCNN之后,rbg(Ross Girshick)大...

10年后再看Robust Real-Time Face Detection(二) 之积分图

我们知道, 如果采用Naive 的方法去计算矩形特征值是相当的玛
  • a130737
  • a130737
  • 2014年05月30日 22:01
  • 1707

10年后再看Robust Real-Time Face Detection(二) 之学习分类函数

给定我们一个特征集合, 一个训练样本集(也就是一幅幅样本图像。 图像可能是有人脸的图像(称为positive images), 图像也可能不含人脸的图像(negative images))。 那么我们...
  • a130737
  • a130737
  • 2014年05月31日 20:13
  • 1618

Robust Real-Time Face Detection

  • 2015年05月14日 19:20
  • 44KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:经典计算机视觉论文笔记——《Robust Real-Time Face Detection》
举报原因:
原因补充:

(最多只允许输入30个字)