Improving Multiview Face Detection with Multi-Task Deep Convolutional Neural Networks 基于深度学习的人脸检测算法

Improving Multiview Face Detection with Multi-Task Deep Convolutional Neural Networks

概述:这是一篇基于深度卷积神经网络的人脸检测论文,达到了很好的效果,同时速度相比起其他深度学习系的方法也有所提高。

算法流程:

1. 作者先使用几个级联的 Multiview detector来对输入图片进行初步鉴别,以此来剔除掉大量的非人脸图片。

   

2. 接着再将通过第一步的图片进行一些pre-processed,然后输入到作者自己训练的一个DCNN里面去,得到最终的结果(包括是否是face,face pose,face landmarks)。


算法具体实现过程:

1. 构造训练集(略,有兴趣的读者请自行阅读论文)。


2. 使用boosting-based的集成学习方法(参考 C. Zhang and Z. Zhang. Winner-take-all multiple category boosting for multi-view face detection. In ECCV Workshop on Face Detection: Where are we, and what next, 2009. 1, 2),训练得到级联多视角人脸检测model。事实上,其他多视角人脸检测model也是可以应用到这里的,因此我就不特地讲解这个boosting-based算法了。特别注意的是,我们应该慎重地选择该级联检测器的阈值,以达到True Positive Rate和False Positive Rate的平衡。


3. 图像预处理,第一步使用standard histogram equalization来增强图像的对比度,第二步使用一个线性变换来再次修改图片光强,该线性变换如下:

ax+by+c=I

其中(x,y)代表像素坐标,使用最小二乘法来计算获得参数a,b,c,进而用I-ax-by-c来作为该坐标点新的光强。

第三步再进行归一化处理,至此图像预处理完成。

其主要效果是增强对比度以及移除阴影(或者说使得阴影更加容易辨识)。


4. 训练DCNN

作者构建的DCNN结构如图所示:

其中各个卷积层我就不解释了,使用的池化手段是最大池化。

值得注意的是,作者的模型的输出包括三者:face/non-face,face pose,facial landmarks

针对输出的不同,在训练过程中使用的loss函数也是不通的,如下:

1. face/non-face输出2个值,其loss函数为交叉熵函数:

2. face pose输出5个值,分别代表不同的脸部朝向,loss函数也是交叉熵函数:

3. facial landmark输出14个值,分别对应7个landmarks的坐标,其loss函数是一个weighted mean square error:
                                                                                                       

结合三者,总的loss函数为三者的线性组合:

训练细节以及参数我在此就不一一贴出,有兴趣的读者请自行学习。



 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
几篇CVPR关于multi-task的论文笔记整理,包括 一、 多任务课程学习Curriculum Learning of Multiple Tasks 1 --------------^CVPR2015/CVPR2016v--------------- 5 二、 词典对分类器驱动卷积神经网络进行对象检测Dictionary Pair Classifier Driven Convolutional Neural Networks for Object Detection 5 三、 用于同时检测和分割的多尺度贴片聚合(MPA)* Multi-scale Patch Aggregation (MPA) for Simultaneous Detection and Segmentation ∗ 7 四、 通过多任务网络级联实现感知语义分割Instance-aware Semantic Segmentation via Multi-task Network Cascades 10 五、 十字绣网络多任务学习Cross-stitch Networks for Multi-task Learning 15 --------------^CVPR2016/CVPR2017v--------------- 23 六、 多任务相关粒子滤波器用于鲁棒物体跟踪Multi-Task Correlation Particle Filter for Robust Object Tracking 23 七、 多任务网络中的全自适应特征共享与人物属性分类中的应用Fully-Adaptive Feature Sharing in Multi-Task Networks With Applications in Person Attribute Classification 28 八、 超越triplet loss:一个深层次的四重网络,用于人员重新识别Beyond triplet loss: a deep quadruplet network for person re-identification 33 九、 弱监督级联卷积网络Weakly Supervised Cascaded Convolutional Networks 38 十、 从单一图像深度联合雨水检测和去除Deep Joint Rain Detection and Removal from a Single Image 43 十一、 什么可以帮助行人检测?What Can Help Pedestrian Detection? (将额外的特征聚合到基于CNN的行人检测框架) 46 十二、 人员搜索的联合检测和识别特征学习Joint Detection and Identification Feature Learning for Person Search 50 十三、 UberNet:使用多种数据集和有限内存训练用于低,中,高级视觉的通用卷积神经网络UberNet: Training a Universal Convolutional Neural Network for Low-, Mid-, and High-Level Vision using Diverse Datasets and Limited Memory 62 一共13篇,希望能够帮助到大家

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值