mtcnn模型总结

MTCNN是一种级联网络,用于人脸识别任务。它包括P-Net、R-Net和O-Net,每个网络有三个输出:分类、边界框回归和关键点定位。分类使用交叉熵损失,回归问题则采用欧式距离计算损失。在线硬样本挖掘策略用于优化训练过程。
摘要由CSDN通过智能技术生成

mtcnn(cascaded network)

1 数据集的准备(widerface celeba):

   负样本,正样本,部分样本,关键点样本比例=3:1:1:2,正负样本以及部分样本从widerface数据集选出,选择规则为:计算IOU的值,如果该值大于0.65则为正样本,IOU小于0.3定为负样本,IOU范围在0.4到0.65之间的设置为partive数据。关键点样本从celeba数据集中选出, 可以根据标注的边框,在满足正样本的要求下,随机裁剪出图片,然后调整关键点的坐标.

2;模型结构:

三个模型的对比:R-net相比于p-net增加了一个全连接层,目的是通过边框回归和NMS降低fp(这点不是很明白,改天问问大神再更新),O-net是在R-net的基础上增加了卷积层,提高检测的精度。p-net到R-net的输入时用到了resize,同理,R-net到O-net的输入也用到了resize.每个网络的阈值设定一次递增,原因在于经过之前的边框回归以及NMS处理,后续模型的置信度值会变大。

3.损失函数

对于不管是P-n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值