- Bootstrapping Face Detection with Hard Negative Examples,arxiv 16.08(download)
昨天在微博上看到这个论文的时候,很是惊讶,为啥?因为出自小米的为发烧而生(跑分)
=====
论文比较短,主要提出了一个hard negative mining的方式,以及基于faster-rcnn的基础上,利用resnet-50,来训练face detector,在FDDB数据集上获得目前state-of-art的效果。
(笔者认为其效果的提升大部分源于resnet,即选择了更好的模型,hard ming的效果为其次)
=====
hard negative mining:
1 构造一个init training dataset:所有的positive rois和一部分随机选出的negative rois,来训练模型(初步的)
2 按照hard negative mining的alternative 方式进行:
用训练好的模型对所有的negative rois进行刷选,选出符合定义的hard negatives,
并加入到初始构建的training dataset(至于在加入hard negatives之前,有没有扔掉当前的easy negatives,就不清楚了)
3 更新好training dataset后,重新训练模型
4 重复步骤2)和3)直到收敛到较好的效果
=====
之所以这样,如zhujin老大说的那样,一开始模型并不知道什么是easy negative,什么是hard negative,
需要先训练好一个初始的模型,然后再进行hard negative mining。
在交替进行的hard negative mining,每次更新training dataset时,其hard negative的定义越来越严格
(笔者是这么认为的)。
=====
论文具体的hard mining过程如下:(更为详细的,请见论文)
=====
效果如下:(具体可以见:http://vis-www.cs.umass.edu/fddb/results.html)
=====
如果这篇博文对你有帮助,可否赏笔者喝杯奶茶?