本次介绍一篇来自微软的人脸检测文章:
《2016 ECCV Supervised Transformer Network for Efficient Face Detection》.
核心导读:
(1) 训练了一个端到端的级联网络;
(2) 引入了supervised transformer层,可以对候选窗口进行矫正以便后续更好地判断是否为人脸;
(3) 引入了Non-top K的抑制策略,在保证召回率的同时也不会有精度损失;
(4) 引入了ROI卷积策略,可以加速运算。
评价:
检测性能基本属于公开方法的第一梯队(ROC曲线约0.9),速度基本是第一梯队里面最快的,达到CPU上30FPS。(恕我直言,就本文方法的工作量而言,30FPS估计是一个很难复现的数字)
—————— Network Architecture ——————
先来一个overview: