pytorch实现mtcnn人脸检测算法
原博地址: https://blog.csdn.net/Sierkinhane/article/details/83308658
mtcnn-pytorch代码: https://github.com/Sierkinhane/mtcnn-pytorch(star!)
论文地址: https://kpzhang93.github.io/MTCNN_face_detection_alignment/paper/spl.pdf
这篇博客记录本人复现CSDN博主@Sierkinhane 提供的mtcnn-pytorch人脸检测算法代码的过程,感谢@Sierkinhane的工作。
训练数据准备
下载 WIDER FACE 放在 ./data_set/face_detection路径中
run > python ./anno_store/tool/format/transform.py
下载 CNN_FacePoint 放在 ./data_set/face_landmark路径中
下载地址: http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm
训练步骤
生成P-Net训练数据(positive、negative、part)
run > python mtcnn/data_preprocessing/gen_Pnet_train_data.py
run > python mtcnn/data_preprocessing/assemble_pnet_imglist.py
训练 P-Net
run > python mtcnn/train_net/train_p_net.py
生成R-Net训练数据(positive、negative、part)
run > python mtcnn/data_preprocessing/gen_Rnet_train_data.py (可能你需要修改代码中已经训练好的P-Net模型路径,默认的是原来的模型)
run > python mtcnn/data_preprocessing/assemble_rnet_imglist.py
训练 R-Net
run > python mtcnn/train_net/train_r_net.py
生成O-Net训练数据(positive、negative、part)
run > python mtcnn/data_preprocessing/gen_Onet_train_data.py
run > python mtcnn/data_preprocessing/gen_landmark_48.py
run > python mtcnn/data_preprocessing/assemble_onet_imglist.py
训练 O-Net
run > python mtcnn/train_net/train_o_net.py
Error1: ValueError: low >= high
delta_x = np.random.randint(max(-size,-x1),w)
File "mtrand.pyx", line 1264, in mtrand.RandomState.randint
ValueError: low >= high;;
Solution1:
运行 gen_Pnet_train_data.py 时出现很多小问题,这里没有一一列举。最后发现WIDER FACE 数据库 gt 存储的格式是 box (x_left, y_top,w, h),训练数据准备阶段运行 transform.py 生成的anno_train.txt 转换为以 box (x_left, y_top, x_right, y_bottom)的格式保存,运行成功。
除此之外,WIDER_train\images\54–Rescue54_Rescue_rescuepeople_54_29.jpg 倒数第5个gt给出的w为负数,我直接删除了这个样本。