MTCNN论文阅读及代码理解

MTCNN,全称Joint Face Detection and Alignment using
Multi-task Cascaded Convolutional Networks,2016年提出,论文发表在普通sci上(没有自己研究过,由于sphere face 用的这个才找的), 主要研究的是人脸检测(人脸目标框定位和关键点检测),这篇文章提出三段网络分阶段训练。

PNet:

训练数据:WiderFace(人脸检测)+(Lfw+net)(关键点预测),
人脸检测:根据不同IOU生成对应的人图片,比例为negative:positive:part = 3:1:1,将生成的图片降采样为1212大小的图片,送入网络训练,负样本除了标签信息不需要其他信息,真样本信息(IOU>0.65)除了标签信息还需要标注与ground truth的offset(归一化之后的,不是原始坐标点),
关键点检测:同人脸检测,除了基本从边框抠出来的图片得到其landmark信息(归一化之后的,不是原始坐标点),还做了数据增强:左右镜面转换,左右中心点坐标旋转。
2个回归1个分类的结合:人脸非人脸做分类,bbox和landmark做回归分析,用的都是nn.MSE_Loss
网络:网络架构很简单

复现过程中使用的使三层CNN 3
310 3316 3332 替换 5510,33*16

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值