论文阅读笔记——面盒:一种高精度的中央处理器实时人脸检测器

本文介绍了一种名为FaceBoxes的人脸检测器,该检测器针对CPU设备,能在保持高精度的同时实现实时速度。FaceBoxes采用快速消化卷积层(RDCL)和多尺度卷积层(MSCL)提升性能,通过锚加密策略提高小人脸召回率。在VGA分辨率图像上,FaceBoxes在CPU上可达到20FPS,在GPU上可达125FPS,且速度与面部数量无关。
摘要由CSDN通过智能技术生成

论文简介

标题

  • 英文:《FaceNet: A Unified Embedding for Face Recognition and Clustering》
  • 翻译:《面盒:一种高精度的中央处理器实时人脸检测器》

期刊情况

  • 期刊:《Conference on Computer Vision and Pattern Recognition》

论文内容

摘要

虽然人脸检测已经取得了巨大的进步,但仍然存在的一个挑战是在中央处理器上实现实时速度并保持高性能,因为有效的人脸检测模型在计算上往往是禁止的。为了应对这一挑战,我们提出了一种新的人脸检测器,称为面盒,具有卓越的性能,在速度和准确性。具体来说,我们的方法有一个轻量级但强大的网络结构,由快速消化卷积层(RDCL)和多尺度卷积层(MSCL)组成RDCL旨在使FaceBoxes能够在CPU上实现实时速度。MSCL的目标是丰富感受野,将锚分散在不同的层面上,以处理不同尺度的表面。此外,我们提出了一种新的锚加密策略,使不同类型的锚在图像上具有相同的密度,从而显著提高了小人脸的召回率。因此,所提出的检测器在单个中央处理器内核上以20帧/秒的速度运行,在VGA分辨率图像上使用GPU以125帧/秒的速度运行。此外,面盒的速度与面的数量无关。我们对这种方法进行了综合评估,并在几个人脸检测基准数据集上展示了最先进的检测性能,包括AFW、PASCAL人脸和FDDB。


介绍

  • 人脸检测是计算机视觉和模式识别的基本问题之一。它在许多后续的人脸相关应用中发挥着重要作用,如人脸对齐,人脸识别和人脸跟踪。随着过去几十年的巨大进步,特别是卷积神经网络的突破,人脸检测已经成功地应用于我们日常生活的各种场景中。

  • 然而,在不受控制的人脸检测问题上仍然存在一些严峻的挑战,尤其是对CPU设备而言。挑战主要来自于对人脸检测器的两个要求:

    • 1)复杂背景下人脸的视觉变化大,要求人脸检测器能够准确解决复杂的人脸和非人脸分类问题
    • 2)可能的面部位置和面部尺寸的大搜索空间进一步强加了时间效率要求。这两个要求是相互冲突的,因为高精度的人脸检测器往往计算量很大。
      因此,在CPU设备上实现实时速度并保持高性能是实用人脸检测器仍然面临的问题之一
  • 为了满足这两个相互冲突的要求,人脸检测主要从两个方面进行了深入的研究。

    • 早期的方式是基于手工特征。继Viola-Jones人脸检测器的开创性工作之后,早期的工作大多集中在设计鲁棒的特征和训练有效的分类器上。除级联结构外,将可变形部件模型引入人脸检测任务,取得了显著的效果。然而,这些方法高度依赖于非鲁棒的手工特征,并且分别优化每个组件,使得人脸检测流水线次优。简而言之,它们在CPU上是高效的,但是在面对大的视觉变化时不够精确
    • 另一种方法是基于卷积神经网络(CNN),近年来取得了显著的成功,从图像分类到目标检测。最近,CNN已经被成功地引入到人脸检测任务中,作为传统人脸检测框架中的特征提取器。此外,一些人脸检测器从普通的物体检测方法中继承了有效的技术,例如快速人脸检测。这些基于CNN的人脸检测方法对面部外观的巨大变化具有鲁棒性,并表现出最先进的性能但是它们太耗时,无法实现实时速度,尤其是在CPU设备上
  • 这两种方式各有优势。前者速度快,后者精度高。为了在速度和精度上表现良好,一个自然的的想法是结合这两种方法的优势。因此,提出了基于级联CNN的方法,将CNN学习的特征放入级联框架中,以提高性能并保持效率。然而,基于级联CNN的方法存在三个问题:

    • 它们的速度与图像上的人脸数量负相关。速度会随着人脸数量的增加而急剧下降;
    • 基于级联的检测器分别优化每个组件,使得训练过程极其复杂,并且最终的模型是次优的;
    • 对于VGA分辨率的图像,它们在CPU上的运行效率约为14 FPS,不足以达到实时速度
  • 在本文中,我们受Farter R-CNN中的RPN和SSD中的多尺度机制的启发,开发了一种在CPU上具有实时速度的最先进的人脸检测器。具体来说,我们提出了一种新的人脸检测器,称为FaceBoxes,它只包含一个完全卷积的神经网络,可以端到端地训练。所提出的方法具有轻量级但强大的网络结构(如图1所示),该网络结构由快速消化卷积层(RDCL)和多尺度卷积层(MSCL)组成。RDCL旨在使FaceBoxes在CPU上实现实时速度&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值