【dlib代码解读】人脸检测器的训练

最新推荐文章于 2024-08-16 21:17:34 发布

Elaine_Bao

最新推荐文章于 2024-08-16 21:17:34 发布

阅读量2.3w

点赞数 12

分类专栏：计算机视觉文章标签： dlib svm HOG

本文链接：https://blog.csdn.net/elaine_bao/article/details/53046542

版权

本文详述了使用dlib库训练基于HOG的人脸检测器的过程，包括预处理、训练和测试阶段。介绍了训练集和测试集的准备、图片上采样、镜像处理、扫描窗口设置、SVM模型训练以及检测器的使用和存储。训练得到的检测器针对正脸，适合联合多个detector使用以提高检测效果。

摘要由CSDN通过智能技术生成

#1. 综述
首先给出实验结果。训练得到的基于hog的人脸检测器如图左，可以看出这是一个主要针对正脸的人脸检测器。对几张测试图片的人脸检测效果如图右：
这里写图片描述
以下给出完整的人脸检测器训练代码（详细代码解读请看第2部分）：

/*faceDetectorTrain.cpp
function:借助dlib训练自己的人脸检测器(参考dlib/examples/fhog_object_detector_ex)
date:2016/11/5
author:Elaine_Bao
*/

#include <dlib/svm_threaded.h>
#include <dlib/gui_widgets.h>
#include <dlib/image_processing.h>
#include <dlib/data_io.h>

#include <iostream>
#include <fstream>

using namespace std;
using namespace dlib;

// ----------------------------------------------------------------------------------------

int main(int argc, char** argv)
{

	try
	{
		//一、preprocessing
		//1. 载入训练集，测试集
		const std::string faces_directory = "faces";
		dlib::array<array2d<unsigned char> > images_train, images_test;
		std::vector<std::vector<rectangle> > face_boxes_train, face_boxes_test;

		load_image_dataset(images_train, face_boxes_train, faces_directory + "/training.xml");
		load_image_dataset(images_test, face_boxes_test, faces_directory + "/testing.xml");

		//2.图片上采样
		upsample_image_dataset<pyramid_down<2> >(images_train, face_boxes_train);
		upsample_image_dataset<pyramid_down<2> >(images_test, face_boxes_test);
		
		//3.训练图片做镜像处理，扩充训练集
		add_image_left_right_flips(images_train, face_boxes_train);

		//二、training
		//1.定义scanner类型，用于扫描图片并提取特征（HOG）
		typedef scan_fhog_pyramid<pyramid_down<6> > image_scanner_type;
		image_scanner_type scanner;
		
		//2. 设置scanner扫描窗口大小
		scanner.set_detection_window_size(80, 80);
		
		//3.定义trainer类型（SVM），用于训练人脸检测器				  
	structural_object_detection_trainer<image_scanner_type> trainer(scanner);
		// Set this to the number of processing cores on your machine.
		trainer.set_num_threads(4);
		// 设置SVM的参数C，C越大表示更好地去拟合训练集，当然也有可能造成过拟合。通过尝试不同C在测试集上的效果得到最佳值
		trainer.set_c(1); 
		trainer.be_verbose();
		//设置训练结束条件，"risk gap"<0.01时训练结束，值越小表示SVM优化问题越精确，训练时间也会越久。
		//通常取0.1-0.01.在verbose模式下每一轮的risk gap都会打印出来。
		trainer.set_epsilon(0.01);

		//4.训练，生成object_detector
		object_detector<image_scanner_type> detector = trainer.train(images_train, face_boxes_train);

		//三、测试
		// 输出precision, re