STN系列之人脸检测

本文介绍了微软采用STN(Spatial Transformer Network)进行高效人脸检测的研究。通过结合landmark回归器和Transformer Network (TN),在Faster R-CNN框架下提升检测性能。STN学习动态对齐方法,ROI卷积加速预测,非Top-K抑制策略优化候选框选择,旨在减少误检并提高召回率。实验结果显示,虽然TN直接影响不大,但ROI卷积和特征组合对结果提升显著。
摘要由CSDN通过智能技术生成

介绍一篇微软用STN做人脸检测的工作。Supervised Transformer Network for Efficient Face Detection;Dong Chen, Gang Hua, Fang Wen, and Jian Sun

Motivation:

前面介绍过了STN(spatial transformer network)做识别任务的工作,在人脸这个问题上利用landmark对齐是一个传统的标准做法,旋转平移变换到一个标准脸上再进 行后续的识别。那么在检测里面预测都会输出一个分类的概率来表示当前这个框选物体是否为目标物体,即是不是一个误检,如果没有做对齐的话因为姿态、表情等变化可能会导致这个分类问题变难。在我们实际做的时候也是会基于landmark的信息来单独训练分类器去实现误检判断的,这里基于STN的思想,作者提出了让网络自己学习对齐方法,在faster rcnn的框架下提升检测的效果。除了STN之外,作者还研究了ROI convolution对结果的影响,也是十分直观合理的做法。

基本原理:

 

直接上图,基于RPN和RCNN的two-stage网络结构,在RPN之后加入一个landmark回归器,使RPN成为一个多任务RPN,并在landmark的后面接一个transformer network(TN),这个TN的参数用相似变换来举例就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值