利用SVM训练自己的XML文件

最新推荐文章于 2022-03-25 06:48:13 发布

Armily

最新推荐文章于 2022-03-25 06:48:13 发布

阅读量1.5k

点赞数

分类专栏： HOG+SVM行人检测

HOG+SVM行人检测专栏收录该内容

14 篇文章 1 订阅

订阅专栏

在人脸检测中，我们一般利用训练好的XML文件去预测图像中是否存在人脸，那么XML文件是如何得到的，按照人脸的XML文件，它应该是提取样本的Haar特征，利用某个机器学习方法，最终得到的。本文主要讨论如何得到自己的XML文件。

在机器学习中，首先应该是采集样本，然后提取他们的特征，本人主要利用HOG特征进行实验。

1、采集样本图像（正样本和负样本），将其归一化到一个的尺度，如48X48.

2、将样本图像的名称写到一个TXT文件，方便程序调用.

3、依次提取每张图像的HOG特征向量.

4、利用SVM进行训练.

5、得到XML文件

具体代码如下：

HOG特征向量计算方法：

利用矩形HOG结构，2×2个cell组成一个block块，每个cell由8×8像素的图像区域组成，步长N为8，而每个cell的梯度方向从0⁰-360⁰分成9个方向块。对于0⁰-180⁰的方向均匀投影到9个方向块，比如0⁰-20⁰投影到a₁块，20⁰-40⁰投影到a₂块。也就是说每个cell要对9维的特征进行梯度幅度投影，形成9维的特征向量，block内的四个cell独立产生9维的特征向量，计算某个cell的特征向量时，投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影，投影的权重使用三线性插值方法，这样在48×48的图片大小下，利用公式

其中W为图片的宽，H为图片的高，wb和hb为block的宽与高，stride为cell的大小，bins为投影的区块，n为一个block中包含的cell的个数。就产生900维的特征向量。

//extract the hog feature from images从图像中提取hog特征 //

#define HOG_VECTOR 900 // 图像HOG特征向量 ((48-16)/8 + 1)*(48-16)/8 + 1)*9*4=900

#define TRAIN_IMG_NUM 800 //总共的样本（图像）数

HOGDescriptor hog(cvSize(48,48),cvSize(16,16),cvSize(8,8), cvSize(8,8),9,1,-1,HOGDescriptor::L2Hys,

0.2,false,HOGDescriptor::DEFAULT_NLEVELS); //初始化HOG描述符

vector<float>descrip;

vector<float>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM); //将所有HOG特征向量保存在vector中

vector<float>::iterator pos;

pos = totaldescrip.begin();

int ImageNum=0;

Mat img;

FILE* f = "pictures.txt"; //存放样本图像

char _filename[1024];

for (;;)

{

char* filename = _filename;

if(f)

{

if(!fgets(filename, (int)sizeof(_filename)-2, f))

break;

//while(*filename && isspace(*filename))

// ++filename;

if(filename[0] == '#')

continue;

int l = strlen(filename);

while(l > 0 && isspace(filename[l-1]))

--l;

filename[l] = '\0';

img = imread(filename);

}

printf("%s:\n", filename);

if(!img.data)

continue;

fflush(stdout);

hog.compute(img,descrip); //计算每幅图像的HOG特征向量

vector<float>::iterator iter;

for (iter=descrip.begin();iter!=descrip.end();iter++,pos++)

{

*pos=*iter;

}

}

float* buf2=&totaldescrip[0];

Mat data_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);

//将图像标记为两类：1->正样本；2->负样本

Mat res_mat=Mat::ones(TRAIN_IMG_NUM,1,CV_32SC1);

for (int k=400;k<800;k++)

{

res_mat.at<unsigned int>(k, 0)=2;

}

//利用SVM进行训练,生成XML文件

TermCriteria criteria;

SVM svm = SVM ();

SVMParams param;

criteria = cvTermCriteria (CV_TERMCRIT_EPS, 1000, FLT_EPSILON);

param = SVMParams (SVM::C_SVC, SVM::LINEAR, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria);

svm.train(data_mat,res_mat,Mat(), Mat(), param);

svm.save ("svm_image.xml");

预测代码：

hog.compute(img,descrip3);

float* buf3=&descrip3[0];

Mat hog_data_mat(1,900,CV_32FC1,buf3);

SVM svm_hog=CvSVM();

svm_hog.load("svm_image.xml");

float index=0.;

index=svm_hog.predict(hog_data_mat);

cout<<"index="<<index<<endl;

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。