TinaFace:人脸检测新纪录

本文作者:mileistone(来自媒智科技) | 编辑:Amusi
https://zhuanlan.zhihu.com/p/315511581
本文已由原作者授权,不得擅自二次转载

这几年人脸检测的benchmark越刷越高,方法也越来越复杂,提出的模块或者方法大都专门为人脸检测设计,不易复现和使用,比如DSFD里的FEM、PAL、IAM,ASFD里的AutoFEM、PAL、IAM、DRMC loss,HAMBox里的PA、OAM、RAL等等。

在这里插入图片描述

WIDER FACE验证集hard结果

在这里插入图片描述

WIDER FACE测试集hard结果

在这里插入图片描述

  • 论文:https://arxiv.org/abs/2011.13183
  • 代码链接:https://github.com/Media-Smart/vedadet/tree/main/configs/trainval/tinaface

鉴于此,我们设计了一个简单而又强大的人脸检测模型——TinaFace,该模型基于RetinaNet,相比RetinaNet只做了很小的改动:

  • 将BN换成GN;
  • 加了一个IoU预测分支;
  • 在backbone上嵌入了DCNv1;
  • 将框回归的loss从smooth l1 loss替换为DIoU loss。

在仅使用ResNet50作为backbone的情况下,TinaFace在WIDER FACE的验证集和测试集中的hard上达到了当前的state of the art。我们只看hard的原因在于WIDER FACE的easy和medium都包含在hard之中,hard体现的是一个人脸检测器在所有人脸上的检测效果。

具体来说,在单模型,backbone仅为ResNet50的情况下。

1、验证集上

1.1、不使用TTA的TinaFace:TinaFace的AP为93.0%,比基于ResNet152的ASFD(使用TTA)高0.5%,比基于ResNet152的DSFD(使用TTA)高1.8%;

1.2、使用TTA的TinaFace:TinaFace的AP为93.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%。

2、测试集上

2.1、不使用TTA的TinaFace:TinaFace的AP为92.1%,与基于ResNet152的ASFD(使用TTA)一样,比基于ResNet152的DSFD(使用TTA)高2.1%;

2.2、使用TTA的TinaFace:TinaFace的AP为92.4%,比基于ResNet50的HAMBox(使用TTA)高0.1%。

在这里插入图片描述
在这里插入图片描述

TinaFace非常简单,基于RetinaNet,所添加的模块在在通用的目标检测框架(比如mmdetection、vedadet)中都是现成的。而且训练不需要大batch,即使你的显存只有11G,也可以复现TinaFace。也正因为TinaFace使用的模块都非常经典、成熟,TinaFace也会比较容易部署。

我们的代码开源地址为TinaFace,基于vedadet,里面提供当前最好结果的权重,以及训练、测试、推理代码,无论大家是想做研究、打比赛、还是仅仅想体验state of the art的效果,这个repo都能满足你。

vedadet能做到的不仅于此,vedadet是我们基于mmdetection开发的单阶段目标检测框架,适用任意目标检测任务,无论是人脸检测还是通用目标检测。vedadet提供训练、测试、推理特性,后续会支持转ONNX/TensorRT,以及基于TensorRT的Python前端SDK或者C++前端SDK。

https://github.com/Media-Smart/vedadet

想了解实验细节的朋友可以参见论文TinaFace: Strong but Simple Baseline for Face Detection。实验中使用的数据分析工具我们也开源了——volkscv。

https://github.com/Media-Smart/volkscv

上述论文和代码下载

在CVer微信公众号后台回复:TinaFace,即可下载上述论文PDF和项目源代码

目标检测综述下载

后台回复:目标检测二十年,即可下载39页的目标检测最全综述,共计411篇参考文献。

下载2

后台回复:CVPR2020,即可下载代码开源的论文合集
后台回复:ECCV2020,即可下载代码开源的论文合集
后台回复:YOLO,即可下载YOLOv4论文和代码

重磅!CVer-目标检测 微信交流群已成立

扫码添加CVer助手,可申请加入CVer-目标检测 微信交流群,目前已汇集4000人!涵盖2D/3D目标检测、小目标检测、遥感目标检测等。互相交流,一起进步!

同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

在这里插入图片描述

▲长按加群

在这里插入图片描述

▲长按关注我们

整理不易,请给CVer点赞!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值