mtcnn模型总结

mtcnn(cascaded network)

1 数据集的准备(widerface celeba):

   负样本,正样本,部分样本,关键点样本比例=3:1:1:2,正负样本以及部分样本从widerface数据集选出,选择规则为:计算IOU的值,如果该值大于0.65则为正样本,IOU小于0.3定为负样本,IOU范围在0.4到0.65之间的设置为partive数据。关键点样本从celeba数据集中选出, 可以根据标注的边框,在满足正样本的要求下,随机裁剪出图片,然后调整关键点的坐标.

2;模型结构:

三个模型的对比:R-net相比于p-net增加了一个全连接层,目的是通过边框回归和NMS降低fp(这点不是很明白,改天问问大神再更新),O-net是在R-net的基础上增加了卷积层,提高检测的精度。p-net到R-net的输入时用到了resize,同理,R-net到O-net的输入也用到了resize.每个网络的阈值设定一次递增,原因在于经过之前的边框回归以及NMS处理,后续模型的置信度值会变大。

3.损失函数

对于不管是P-n

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch MTCNN(多任务协同神经网络)是一个用于人脸检测和人脸对齐的深度学习模型MTCNN由三个子网络组成,分别是人脸检测网络(P-Net)、人脸对齐网络(R-Net)和人脸特征点定位网络(L-Net)。 P-Net是MTCNN的第一个子网络,主要用于人脸区域的快速初步筛选。它采用了类似于Sliding Window的滑动窗口方法,通过多尺度的卷积神经网络来生成多个候选框,并使用分类和回归任务来预测人脸的存在和边界框的修正。 R-Net是MTCNN的第二个子网络,用于对P-Net生成的候选框进行更准确的修正。它首先对候选框进行Resize操作,然后通过卷积神经网络来对每个候选框进行分类和回归,以得到更准确的人脸框。 L-Net是MTCNN的第三个子网络,用于人脸特征点(如眼睛、鼻子、嘴巴等)的定位。它先通过Resize操作将候选框调整为固定大小,然后利用卷积神经网络对候选框进行特征点的回归定位。 PyTorch MTCNN是基于PyTorch框架实现的MTCNN模型。它提供了一个简单易用的接口,可以方便地加载和使用预训练的MTCNN模型进行人脸检测和人脸对齐任务。通过PyTorch MTCNN,我们可以快速地检测出图像中的人脸并对其进行对齐,为后续的人脸识别、表情识别等任务提供数据基础。 总结来说,PyTorch MTCNN是一个用于人脸检测和对齐的深度学习模型,它通过P-Net、R-Net和L-Net三个子网络协同工作来实现准确的人脸检测和特征点定位。它的应用范围广泛,可以用于人脸识别、表情识别、姿态估计等多个领域。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值