用Adaboost对自己的数据分类

最新推荐文章于 2023-03-19 22:39:47 发布

元气少女缘结神

最新推荐文章于 2023-03-19 22:39:47 发布

阅读量3.8k

点赞数

分类专栏： OpenCV Basises ML 文章标签：模式识别

本文链接：https://blog.csdn.net/wd1603926823/article/details/51689459

版权

OpenCV Basises 同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

想用Adaboost分类器对自己的数据分类而网上一查好多都是Adaboost+Harr人脸检测啥啥啥的所以只能自己写了参考http://blog.csdn.net/zhaocj/article/details/50536385的用Adaboost算法对自己的数据集分类。特征和标签都是csv文件：特征矩阵是224X1000维的，类别是2就是二分类，

int main(int argc, char** argv)
{

//打乱顺序结果在kuangvec[]和stonevec[]两个数组里图像标号
const int uselesssample = 134, usefulsample = 90, allsample = 224,featurecol=1000;
//打乱顺序前90个为矿后134个为废石
int kuangvec[usefulsample], stonevec[uselesssample];
for (int i = 0; i < usefulsample; i++)
kuangvec[i] = i ;
for (int i = 0; i <uselesssample; i++)
stonevec[i] = usefulsample+i;
random_shuffle(kuangvec, kuangvec+usefulsample);
random_shuffle(stonevec, stonevec + uselesssample);
///show fixed ranks
//for (int i = 0; i < usefulsample; i++)
// cout << kuangvec[i] << endl;
//cout << endl;
//for (int i = 0; i < uselesssample; i++)
// cout << stonevec[i] << endl;
/read features
CvMLData cvmlprimer;
cvmlprimer.read_csv("features.csv");
cv::Mat cvml = cv::Mat(cvmlprimer.get_values(),true);
CvMLData resprimer;
resprimer.read_csv("labels.csv");
cv::Mat res = cv::Mat(resprimer.get_values(), true);
/saperate into trainset
const float rate =0.6;
int trainnum=int(usefulsample*rate)+int(uselesssample*rate), testnum=allsample-trainnum;
Mat traindata=Mat::zeros(trainnum, featurecol, cvml.type()), testdata=Mat::zeros(testnum, featurecol, cvml.type()), trainlabel=Mat::zeros(trainnum, 1, res.type()), testlabel=Mat::zeros(testnum,1, res.type());
for (int i = 0; i <int(usefulsample*rate); i++)
{
float* newrow = traindata.ptr<float>(i);
int currentrow = kuangvec[i];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = trainlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
for (int i = int(usefulsample*rate); i <trainnum; i++)
{
float* newrow = traindata.ptr<float>(i);
int ii = i - int(usefulsample*rate);
int currentrow = stonevec[ii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = trainlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
//saperate into testset
for (int i = 0; i <usefulsample-int(usefulsample*rate); i++)
{
float* newrow = testdata.ptr<float>(i);
int iii = i + int(usefulsample*rate);
int currentrow = kuangvec[iii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = testlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
for (int i = usefulsample - int(usefulsample*rate); i <testnum; i++)
{
int ii = int(uselesssample*rate) + i - (usefulsample - int(usefulsample*rate));
float* newrow = testdata.ptr<float>(i);
int currentrow = stonevec[ii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = testlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
//trainset and testset have done!/
//for (int i = 0; i < trainnum; i++) //check the trainlabel and testlabel
//{
// float* row = trainlabel.ptr<float>(i);
// cout <<row[0]<< endl;
//}
//cout << "trainlabel= "<<trainnum << endl;
//for (int i = 0; i < testnum; i++)
//{
// float* row = testlabel.ptr<float>(i);
// cout << row[0]<<endl;
//}
CvMat traindata2 =traindata, trainlabel2 =trainlabel;
const CvMat* traindata3 = cvCreateMat(traindata2.rows, traindata2.cols, traindata2.type);
const CvMat* trainlabel3 = cvCreateMat(trainlabel2.rows, trainlabel2.cols, trainlabel2.type);
printf("Ready for Training ... ");
float priors[1000] = { 1, 1, 1, };
CvBoostParams params(CvBoost::GENTLE, 10, 0.95, 1, false, priors);
CvBoost boost;
bool update = false;
const CvMat* varIdx = 0;
const CvMat* sampleIdx = 0;
const CvMat* varType = 0;
const CvMat* missingDataMask = 0;
boost.train(traindata3,CV_ROW_SAMPLE, trainlabel3, varIdx, sampleIdx, varType, missingDataMask, params, update);
cout << "training done!" << endl;
// 1. Declare a couple of vectors to save the predictions of each sample
//std::vector train_responses, test_responses;
// 2. Calculate the training error
//float fl1 = boost.calc_error(&cvml, CV_TRAIN_ERROR, &train_responses);
// 3. Calculate the test error
//float fl2 = boost.calc_error(&cvml, CV_TEST_ERROR, &test_responses);
//printf("Error train %f \n", fl1);
//printf("Error test %f \n", fl2);
// Save the trained classifier
//boost.save("./trained_boost.xml", "boost");
//return EXIT_SUCCESS;
return 0;
}

我上面只是train 可是用Adaboost训练时候就报错说只能用来二分类可是我检查我的标签结果证明是二分类啊训练标签是1和2两个类都拿出了60%作为训练集两个类剩下的40%作为测试集可是为什么train的时候报这样的错呢？

搞了一上午终于知道为什么了从traindata转成CvMat*时候没有复制数据只是复制了信息头所以trian里面是没有任何数据的！！！太蠢了

改成了这样：

#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/ml/ml.hpp"
#include <iostream>
#include<algorithm>
#include<opencv2/opencv.hpp>
using namespace cv;
using namespace std;
int main(int argc, char** argv)
{
//打乱顺序结果在kuangvec[]和stonevec[]两个数组里图像标号
const int uselesssample = 134, usefulsample = 90, allsample = 224,featurecol=1000;
//打乱顺序前90个为矿后134个为废石
int kuangvec[usefulsample], stonevec[uselesssample];
for (int i = 0; i < usefulsample; i++)
kuangvec[i] = i ;
for (int i = 0; i <uselesssample; i++)
stonevec[i] = usefulsample+i;
random_shuffle(kuangvec, kuangvec+usefulsample);
random_shuffle(stonevec, stonevec + uselesssample);
///show fixed ranks
//for (int i = 0; i < usefulsample; i++)
// cout << kuangvec[i] << endl;
//cout << endl;
//for (int i = 0; i < uselesssample; i++)
// cout << stonevec[i] << endl;
/read features
CvMLData cvmlprimer;
cvmlprimer.read_csv("features.csv");
cv::Mat cvml = cv::Mat(cvmlprimer.get_values(),true);
CvMLData resprimer;
resprimer.read_csv("labels.csv");
cv::Mat res = cv::Mat(resprimer.get_values(), true);
/saperate into trainset randomly
const float rate =0.6;
int trainnum=int(usefulsample*rate)+int(uselesssample*rate), testnum=allsample-trainnum;
Mat traindata=Mat::zeros(trainnum, featurecol, cvml.type()), testdata=Mat::zeros(testnum, featurecol, cvml.type()), trainlabel=Mat::zeros(trainnum, 1, res.type()), testlabel=Mat::zeros(testnum,1, res.type());
for (int i = 0; i <int(usefulsample*rate); i++)
{
float* newrow = traindata.ptr<float>(i);
int currentrow = kuangvec[i];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = trainlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
for (int i = int(usefulsample*rate); i <trainnum; i++)
{
float* newrow = traindata.ptr<float>(i);
int ii = i - int(usefulsample*rate);
int currentrow = stonevec[ii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = trainlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
//saperate into testset
for (int i = 0; i <usefulsample-int(usefulsample*rate); i++)
{
float* newrow = testdata.ptr<float>(i);
int iii = i + int(usefulsample*rate);
int currentrow = kuangvec[iii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = testlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
for (int i = usefulsample - int(usefulsample*rate); i <testnum; i++)
{
int ii = int(uselesssample*rate) + i - (usefulsample - int(usefulsample*rate));
float* newrow = testdata.ptr<float>(i);
int currentrow = stonevec[ii];
float* primerow = cvml.ptr<float>(currentrow);
for (int j = 0; j < featurecol; j++)
newrow[j] = primerow[j];
float* newlabelrow = testlabel.ptr<float>(i);
float* primerlabelrow = res.ptr<float>(currentrow);
newlabelrow[0] = primerlabelrow[0];
}
//trainset and testset have done!/
//for (int i = 0; i < trainnum; i++) //check the trainlabel and testlabel
//{
// float* row = trainlabel.ptr<float>(i);
// cout <<row[0]<< endl;
//}
//cout << "trainlabel= "<<trainnum << endl;
//for (int i = 0; i < testnum; i++)
//{
// float* row = testlabel.ptr<float>(i);
// cout << row[0]<<endl;
//}
//cout << "testlabel= " << testnum << endl;
CvMat traindata2 = traindata, trainlabel2 = trainlabel;
CvMat* traindata3 = cvCreateMat(traindata2.rows, traindata2.cols, traindata2.type);
cvCopy(&traindata2, traindata3);
CvMat* trainlabel3 = cvCreateMat(trainlabel2.rows, trainlabel2.cols, trainlabel2.type);
cvCopy(&trainlabel2, trainlabel3);
cout<<"Ready for Training ... "<<endl;
float priors[1000];
for (int i = 0; i < 1000; i++)
priors[i] = 1;
CvBoostParams params(CvBoost::GENTLE, 1000, 0.95, 1, false, priors);
CvBoost boost;
bool update = false;
const CvMat* varIdx = 0;
const CvMat* sampleIdx = 0;
const CvMat* varType = 0;
const CvMat* missingDataMask = 0;
boost.train(traindata3,CV_ROW_SAMPLE, trainlabel3, varIdx, sampleIdx, varType, missingDataMask, params, update);
cout << "training done!!!prepare for testing..." << endl<<endl;
begin test
CvMat testdata2 = testdata, testlabel2 = testlabel;
CvMat* testdata3 = cvCreateMat(testdata2.rows, testdata2.cols, testdata2.type);
cvCopy(&testdata2, testdata3);
CvMat* testlabel3 = cvCreateMat(testlabel2.rows, testlabel2.cols, testlabel2.type);
cvCopy(&testlabel2, testlabel3);
const CvMat* missing = 0;
CvMat* weak_responses = 0;
const int numfortest = testdata.rows;
float outputs;
outputs=boost.predict(testdata3, missing, weak_responses, CV_WHOLE_SEQ, false);
// 1. Declare a couple of vectors to save the predictions of each sample
//std::vector train_responses, test_responses;
// 2. Calculate the training error
//float fl1 = boost.calc_error(&cvml, CV_TRAIN_ERROR, &train_responses);
// 3. Calculate the test error
//float fl2 = boost.calc_error(&cvml, CV_TEST_ERROR, &test_responses);
//printf("Error train %f \n", fl1);
//printf("Error test %f \n", fl2);
// Save the trained classifier
//boost.save("./trained_boost.xml", "boost");
//return EXIT_SUCCESS;
return 0;
}