腾讯(优图)新技术的人脸检测

导读分享的文章,其提出了一种新的人脸检测网络,解决了人脸检测的三个关键方面,包括更好的特征学习、渐进的损失设计和基于锚的数据增强。首先,提出了一种增强原始特征映射的特征增强模块(FEM),将单个镜头探测器扩展到双镜头探测器。其次,采用由两组不同的锚计算的渐进锚损失(PAL)来有效地促进特征。第三,通过将新的锚分配策略集成到数据增强中,使用了改进的锚匹配(IAM),以提供对REGRESOR的更好的初始化。由于这些技术都与双流设计有关,所以将提出的网络命名为双镜头人脸检测器(DSFD)。对流行的基准,WIDER FACE和FDDB进行了广泛实验,证明了DSFD优于现有技术的人脸检测器的优越性。

640?wx_fmt=png

引言

作为人脸检测的先驱工作,Viola-Jones采用Adaboost算法,具有手工制作的特征,现在已被卷积神经网络(CNN)的深度学习的特征所取代,取得了很大的进步。尽管基于CNN的人脸检测器已经被广泛地研究,但是在真实世界场景中检测具有高度可变性的面部、姿势、遮挡、表情、外观和照明仍然是一个挑战。

现有技术的人脸检测器可以粗略地分成两类,第一个主要是基于Faster RCNN中采用的区域建议网络(RPN),并且采用两级检测方案。RPN是经过训练的端到端,并产生高质量的区域候选,这些候选通过Faster R-CNN探测器进一步完善。另一个是基于单镜头探测器(SSD)的单级方法,该方法摆脱了RPN,直接预测了边界框。

640?wx_fmt=png

640?wx_fmt=png

最近,由于较高的推理效率和直接的系统部署,One shot的人脸检测框架引起了更多的关注。具体分析见“计算机视觉协会”知识星球。

640?wx_fmt=jpeg

Dual Shot Face Detector

DSFD的框架如下图所示。体系结构使用了与Pyramid Box和S3FD相同的扩展VGG16框架,在分类层之前被截断,并添加了一些辅助结构。注意,训练图像的输入尺寸为640,这意味着从最低层到最高层的特征图大小为160到5。不同于S3FD和Pyramid Box,在利用有限元法中的感受野放大和新的锚设计策略后,对于步长、锚和感受野三种尺寸满足等比例间隔原则的情况,都是不必要的。因此,DSFD具有更大的灵活性和鲁棒性。此外,原有的和增强的镜头有两个不同的损失,分别是第一次发射渐进锚损失(FSL)和第二次发射渐进锚损失(SSL)。

640?wx_fmt=png

特征增强模块

特征增强模块能够对原始特征进行增强,使其具有更强的鉴别性和鲁棒性,简称FEM。

640?wx_fmt=jpeg

下图就阐述了FPN和RFB提出的有限元思想。在这里,首先使用1×1卷积核来规范特征映射。然后对上面的特征图进行抽样,用当前的特征映射来制作元素级的产品。最后将特征映射分为三个部分,然后是包含不同数目的膨胀卷积层的三个子网络。

640?wx_fmt=png

实验

特征增强模块的有效性

640?wx_fmt=png

Progressive Anchor Loss 的有效性

Progressive Anchor Loss在知识星球有详细讲解。

640?wx_fmt=png

640?wx_fmt=png

不同尺度人脸的数目分布

640?wx_fmt=png

新技术的可视化结果

*注:具体实施和源码实践的过程会在知识星球分享。

640?wx_fmt=gif

如果想加入我们“计算机视觉战队”,请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域,由来自于各校的硕博研究生组成的团队,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。

我们开创一段时间的“计算机视觉协会”知识星球,也得到很多同学的认可,我们定时会推送实践型内容与大家分享,在星球里的同学可以随时提问,随时提需求,我们都会及时给予回复及给出对应的答复。

640?wx_fmt=jpeg

微信学习讨论群也可以加入,我们会第一时间在该些群里预告!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值