MTCNN 训练记录（待续）

最新推荐文章于 2021-04-21 23:55:26 发布

pingfan2014

最新推荐文章于 2021-04-21 23:55:26 发布

阅读量1.3k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/pingfan2014/article/details/86626864

版权

深度学习专栏收录该内容

7 篇文章 1 订阅

订阅专栏

训练

1.基础问题
a.样本问题，mtcnn训练时，会把训练的原图样本，通过目标所在区域进行裁剪，得到三类训练样本，即：正样本、负样本、部分(part)样本
其中：
裁剪方式：对目标区域，做平移、缩放等变换得到裁剪区域
IoU：目标区域和裁剪区域的重合度

此时三类样本如下定义：
正样本：IoU >= 0.65，标签为1
负样本：IoU < 0.3，标签为0
部分(part)样本：0.65 > IoU >= 0.4，标签为-1

b.网络问题，mtcnn分为三个小网络，分别是PNet、RNet、ONet，新版多了一个关键点回归的Net（这个不谈）。
PNet：12 x 12，负责粗选得到候选框，功能有：分类、回归
RNet：24 x 24，负责筛选PNet的粗筛结果，并微调box使得更加准确和过滤虚警，功能有：分类、回归
ONet：48 x 48，负责最后的筛选判定，并微调box，回归得到keypoint的位置，功能有：分类、回归、关键点

c.网络大小的问题，训练时输入图像大小为网络指定的大小，例如12 x 12，而因为PNet没有全连接层，是全卷积的网络，所以预测识别的时候是没有尺寸要求的，那么PNet可以对任意输入尺寸进行预测得到k个boundingbox和置信度，通过阈值过滤即可完成候选框提取过程，而该网络因为结构小，所以效率非常高。

2.训练步骤
参考：https://github.com/dlunion/mtcnn/tree/master/train
一般训练几万次后，loss到0.0x的时候就可以接受了

记得在当前目录下创建models-12、models-24、models-48来迎接喜气招财哟~

3.使用阶段
将训练的caffemodel，复制到caffemodel_2_mtcnnmodel里面，编译执行他（代码写的必须3个网络同时存在，所以自己看情况改下），这时候产生的mtcnn_models.h，就是我们要的网络头文件，添加到mtcnn-light覆盖下就可以执行看效果

pingfan2014

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
MTCNN 训练记录（待续）

训练1.基础问题a.样本问题，mtcnn训练时，会把训练的原图样本，通过目标所在区域进行裁剪，得到三类训练样本，即：正样本、负样本、部分(part)样本其中：裁剪方式：对目标区域，做平移、缩放等变换得到裁剪区域IoU：目标区域和裁剪区域的重合度此时三类样本如下定义：正样本：IoU &gt;= 0.65，标签为1负样本：IoU &lt; 0.3，标签为0部分(part)样本：0....
复制链接

扫一扫

专栏目录