利用SVM训练自己的XML文件

在人脸检测中,我们一般利用训练好的XML文件去预测图像中是否存在人脸,那么XML文件是如何得到的,按照人脸的XML文件,它应该是提取样本的Haar特征,利用某个机器学习方法,最终得到的。本文主要讨论如何得到自己的XML文件。 

 在机器学习中,首先应该是采集样本,然后提取他们的特征,本人主要利用HOG特征进行实验。

1、采集样本图像(正样本和负样本),将其归一化到一个的尺度,如48X48.

2将样本图像的名称写到一个TXT文件,方便程序调用.

3依次提取每张图像的HOG特征向量.

4、利用SVM进行训练.

5、得到XML文件

具体代码如下:

HOG特征向量计算方法:

利用矩形HOG结构,2×2cell组成一个block块,每个cell8×8像素的图像区域组成,步长N8,而每个cell的梯度方向从00-3600分成9个方向块。对于00-1800的方向均匀投影到9个方向块,比如00-200投影到a1块,200-400投影到a2块。也就是说每个cell要对9维的特征进行梯度幅度投影,形成9维的特征向量block内的四个cell独立产生9维的特征向量,计算某个cell的特征向量时,投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影,投影的权重使用三线性插值方法,这样在48×48的图片大小下,利用公式

其中W为图片的宽,H为图片的高,wbhbblock的宽与高,stridecell的大小,bins为投影的区块,n为一个block中包含的cell的个数。就产生900维的特征向量。

//extract the hog feature from images从图像中提取hog特征 //

 

#define HOG_VECTOR 900      // 图像HOG特征向量  ((48-16)/8 + 1)*(48-16)/8 + 1)*9*4=900

#define TRAIN_IMG_NUM 800  //总共的样本(图像)数

 

HOGDescriptor   hog(cvSize(48,48),cvSize(16,16),cvSize(8,8), cvSize(8,8),9,1,-1,HOGDescriptor::L2Hys,

0.2,false,HOGDescriptor::DEFAULT_NLEVELS);           //初始化HOG描述符

vector<float>descrip;

vector<float>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM);   //将所有HOG特征向量保存在vector

vector<float>::iterator  pos;

pos = totaldescrip.begin();

int ImageNum=0;

Mat img;

FILE* f = "pictures.txt"; //存放样本图像

char  _filename[1024];

 

   for (;;)

        {

            char* filename = _filename;

            if(f)

            {

                if(!fgets(filename, (int)sizeof(_filename)-2, f))

                    break;

                //while(*filename && isspace(*filename))

                //  ++filename;

                if(filename[0] == '#')

                    continue;

                int l = strlen(filename);

                while(l > 0 && isspace(filename[l-1]))

                    --l;

                filename[l] = '\0';

                img = imread(filename);

            }

            printf("%s:\n", filename);

            if(!img.data)

                continue;

     

            fflush(stdout);

            hog.compute(img,descrip);    //计算每幅图像的HOG特征向量

     

            vector<float>::iterator iter;

            for (iter=descrip.begin();iter!=descrip.end();iter++,pos++)

            {

                *pos=*iter;

            }

        }

 

            float* buf2=&totaldescrip[0];

            Mat data_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);

 

            //将图像标记为两类:1->正样本;2->负样本

            Mat res_mat=Mat::ones(TRAIN_IMG_NUM,1,CV_32SC1);

            for (int k=400;k<800;k++)

            {

                res_mat.at<unsigned int>(k, 0)=2;

            }

                  //利用SVM进行训练,生成XML文件

            TermCriteria criteria; 

            SVM svm = SVM (); 

            SVMParams param;

            criteria = cvTermCriteria (CV_TERMCRIT_EPS, 1000, FLT_EPSILON); 

            param = SVMParams (SVM::C_SVC, SVM::LINEAR, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria); 

            svm.train(data_mat,res_mat,Mat(), Mat(), param);

            svm.save ("svm_image.xml");

 

预测代码:

hog.compute(img,descrip3);

                   float* buf3=&descrip3[0];

                   Mat hog_data_mat(1,900,CV_32FC1,buf3);

                   SVM svm_hog=CvSVM();

                   svm_hog.load("svm_image.xml");

                   float index=0.;

                    index=svm_hog.predict(hog_data_mat);

                    cout<<"index="<<index<<endl;

车牌检测的代码可以使用OpenCV库来实现,以下是一个简单的示例代码: ``` import cv2 # 加载车牌检测器 plate_cascade = cv2.CascadeClassifier('haarcascade_russian_plate_number.xml') # 读取图像 img = cv2.imread('car.jpg') # 转为灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 检测车牌 plates = plate_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5) # 在原图像中标出车牌区域 for (x, y, w, h) in plates: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) # 显示结果 cv2.imshow('Plate Detection', img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 注意,这里使用的是基于Haar特征的级联分类器,需要提前下载一个训练好的XML文件(例如上面代码中的`haarcascade_russian_plate_number.xml`)。 接下来是车牌识别的代码,使用的是SVM分类器: ``` import cv2 import numpy as np # 读取训练数据 with np.load('svm_data.npz') as data: train = data['train'] train_labels = data['train_labels'] # 训练SVM模型 svm = cv2.ml.SVM_create() svm.setType(cv2.ml.SVM_C_SVC) svm.setKernel(cv2.ml.SVM_LINEAR) svm.train(train, cv2.ml.ROW_SAMPLE, train_labels) # 读取测试图像 img = cv2.imread('plate.jpg') # 提取图像特征 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) blur = cv2.GaussianBlur(gray, (5, 5), 0) thresh = cv2.adaptiveThreshold(blur, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, 11, 2) contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) rects = [cv2.boundingRect(cnt) for cnt in contours] rects = sorted(rects, key=lambda x: x[0]) # 依次对每个字符进行识别 result = '' for rect in rects: x, y, w, h = rect roi = thresh[y:y+h, x:x+w] roi = cv2.resize(roi, (20, 20)) feature = roi.reshape(1, -1).astype(np.float32) _, result_, _ = svm.predict(feature) result += str(int(result_[0][0])) # 显示识别结果 print(result) ``` 这里使用的训练数据是一个包含车牌字符的图像样本,保存在一个npz文件中。在训练SVM模型时,需要指定SVM的类型(这里选择的是C-SVM)、核函数(这里用的是线性核)等参数。在识别过程中,先使用图像处理技术提取出每个字符的图像,然后利用SVM对每个字符进行分类,最终得到车牌的号码。 需要注意的是,这里的车牌检测和识别代码只是一个简单的示例,实际应用中可能需要更加复杂的算法来处理各种场景下的车牌图像。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值