最近有项目需要利用svm进行光谱数据分类,所以使用了libsvm实现了该分类器,并且效果不错
环境搭建
首先下载libSVM最新的版本
使用VS2017创建一个新的空工程,把上图目录中的svm.cpp和svm.h复制到工程目录下,把这两个文件添加到工程中去。
注意:VS2017中使用fopen会出现一个错误,原因是VS2017自身兼容性不好,认为fopen不安全,可以通过 工程右键——Properties——C++——Preprocesser——Preprocesser Definitions中添加_CRT_SECURE_NO_WARNINGS解决该问题。
同时VS2017中编译会出现strdup函数编译不过去,同样根据提示,把该函数改为_strdup即可。
特征文件的读取
网上对于libsvm有一种误导,就是你的特征文件必须要按照一定的格式来,才能够被读取训练,其实这只是对于使用dos命令行调用libsvm时的规定,因为libsvm自定义的特征文件格式是与其读取相匹配的。如果我们使用自己的读取文件函数,则完全不用拘束于这种格式,只要我们在读取函数之中与我们自己的特征文件格式相匹配即可。
在libsvm中,与读取特征文件相关的类型为svm_problem。这个类中有三个元素,如下所示:
struct svm_problem
{
int n; //记录样本总数
double *y; //记录样本所属类别
struct svm_node **x; //存储所有样本的特征,二维数组,一行存一个样本的所有特征
};
struct svm_node //用来存储输入空间中的单个特征
{
int index; //该特征在特征空间中的维度编号
double value; //该特征的值
};
数据读取的核心思想就是将数据的每个特征的index与value对应填入svm_node中去,最后建立一个svm_problem类,就可以调用libsvm内部的函数了
我的svm类如下所示
#include "svm.h"
#include "readdata.h"
#include "data_standard.h"
#include <iostream>
#include <string>
#include <vector>
#include <deque>
using namespace std;
class ClassificationSVM
{
public:
ClassificationSVM() :SampleNum(0) {
};
~ClassificationSVM() = default;
void trainSVM(); //训练数据
bool predictSVM(vector<double> &datav, const std::string &ModelFileName); //单个数据预测
void multi_predictSVM(vector<bool> &v); //一组数据预测
private:
svm_node* vector2svmnode(const vector<double> &v); //将vector<double>转换为svm_node[]
void setParam();
void readTrainData(std::string type, bool tag, int num, int st = 1); //从 path\typename 第st个数据开始读取num个数据,并记录对应标签为tag(正样本为true