利用HOG+SVM训练自己的XML文件

【原文:http://blog.csdn.net/Armily/article/details/8333862

在人脸检测中,我们一般利用训练好的XML文件去预测图像中是否存在人脸,那么XML文件是如何得到的,按照人脸的XML文件,它应该是提取样本的Haar特征,利用某个机器学习方法,最终得到的。本文主要讨论如何得到自己的XML文件。 

        在机器学习中,首先应该是采集样本,然后提取他们的特征,本人主要利用HOG特征进行实验。

1、采集样本图像(正样本和负样本),将其归一化到一个的尺度,如48X48.

2、将样本图像的名称写到一个TXT文件,方便程序调用.

3、依次提取每张图像的HOG特征向量.

4、利用SVM进行训练.

5、得到XML文件

具体代码如下:

HOG特征向量计算方法:

利用矩形HOG结构,2×2个cell组成一个block块,每个cell由8×8像素的图像区域组成,步长N为8,而每个cell的梯度方向从00-3600分成9个方向块。对于00-1800的方向均匀投影到9个方向块,比如00-200投影到a1块,200-400投影到a2块。也就是说每个cell要对9维的特征进行梯度幅度投影,形成9维的特征向量,block内的四个cell独立产生9维的特征向量,计算某个cell的特征向量时,投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影,投影的权重使用三线性插值方法,这样在48×48的图片大小下,利用公式N = ((W–wb )/stride + 1)*((H-hb)/stride+1)*bins*n    ,        

其中W为图片的宽,H为图片的高,wbhb为block的宽与高,stride为cell的大小,bins为投影的区块,n为一个block中包含的cell的个数。

就产生900维的特征向量。

[html]  view plain copy
  1. //extract the hog feature from images //  
  2.      #define HOG_VECTOR 900    // 图像HOG特征向量  ((48-16)/8 + 1)*(48-16)/8 + 1)*9*4=900  
  3.      #define TRAIN_IMG_NUM 800  //总共的样本(图像)数  
  4.         HOGDescriptor hog(cvSize(48,48),cvSize(16,16),cvSize(8,8),cvSize(8,8),9,1,-           1,HOGDescriptor::L2Hys,0.2,false,HOGDescriptor::DEFAULT_NLEVELS);           //初始化HOG描述符  
  5.         vector<float>descrip;  
  6.         vector<float>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM);   //将所有HOG特征向量保存在vector中  
  7.         vector<float>::iterator pos;  
  8.         pos=totaldescrip.begin();  
  9.         int ImageNum=0;  
  10.          Mat img;  
  11.          FILE* f = "pictures.txt"; //存放样本图像    
  12.   
  13.      char _filename[1024];     
  14.   
  15.          for (;;)  
  16.         {  
  17.             char* filename = _filename;  
  18.             if(f)  
  19.             {  
  20.                 if(!fgets(filename, (int)sizeof(_filename)-2, f))  
  21.                     break;  
  22.                 //while(*filename && isspace(*filename))  
  23.                 //  ++filename;  
  24.                 if(filename[0] == '#')  
  25.                     continue;  
  26.                 int l = strlen(filename);  
  27.                 while(l > 0 && isspace(filename[l-1]))  
  28.                     --l;  
  29.                 filename[l] = '\0';  
  30.                 img = imread(filename);  
  31.             }  
  32.             printf("%s:\n", filename);  
  33.             if(!img.data)  
  34.                 continue;  
  35.        
  36.             fflush(stdout);  
  37.             hog.compute(img,descrip);    //计算每幅图像的HOG特征向量  
  38.        
  39.             vector<float>::iterator iter;  
  40.                           for (iter=descrip.begin();iter!=descrip.end();iter++,pos++)  
  41.                           {  
  42.                     *pos=*iter;  
  43.                           }  
  44.         }  
  45.      
  46.         float* buf2=&totaldescrip[0];  
  47.         Mat data_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);  
  48.   
  49.  //将图像标记为两类:1->正样本;2->负样本  
  50.         Mat res_mat=Mat::ones(TRAIN_IMG_NUM,1,CV_32SC1);  
  51.         for (int k=400;k<800;k++)  
  52.         {  
  53.             res_mat.at<unsigned int>(k, 0)=2;  
  54.         }  
  55.                  //利用SVM进行训练,生成XML文件  
  56.         TermCriteria criteria;    
  57.         SVM svm = SVM ();    
  58.         SVMParams param;  
  59.         criteria = cvTermCriteria (CV_TERMCRIT_EPS, 1000, FLT_EPSILON);    
  60.         param = SVMParams (SVM::C_SVC, SVM::LINEAR, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria);    
  61.         svm.train(data_mat,res_mat,Mat(), Mat(), param);  
  62.         svm.save ("svm_image.xml");  


预测的代码:

   

[html]  view plain copy
  1.               hog.compute(img,descrip3);  
  2.     float* buf3=&descrip3[0];  
  3.     Mat hog_data_mat(1,900,CV_32FC1,buf3);  
  4.   
  5.     SVM svm_hog=CvSVM();  
  6.     svm_hog.load("svm_image.xml");  
  7.     float index=0.;  
  8. index=svm_hog.predict(hog_data_mat);  
  9. cout<<"index="<<index<<endl;  

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
提供的源码资源涵盖了Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值