本次介绍一篇来自旷视科技的人脸检测文章:
《2016 ACM MM UnitBox: An Advanced Object Detection Network》.
代码应该是不会放出来了,但好在实现比较简单。(插播一句,论文里面说速度可以达到12fps,我有点慌,大家看看科学不)
—————————— 分割线 ——————————
Introduction
目标检测可以视作两个任务:目标定位 + 视觉识别。
基于深度学习的目标检测大致又可以分为三个部分:
(1)Region Proposal
这一步主要是为了寻找人脸候选区域,常见的方法有Selective Search、 EdgeBoxes 和stages of cascade detectors。这一步往往是算法的瓶颈所在,与性能和速度关联紧密。
(2)Recognition and Categorization
这一步就是为了对窗口进行分类,二分类(人脸非人脸),或者多分类(多目标检测)。
(3)Bounding Box Regression
进一步调整检测框,使之更加精准。(可以看做由粗到细的refine过程)