在对测试数据进行分类之前,需要先使用训练数据建立一个支持向量模型。模型可以以文件的形式存储以备以后使用。一旦建立好了支持向量机模型,就可以用它来对新的数据进行分类了。
-函数:struct svm_model *svm_train(const struct svm_problem *prob, const struct svm_parameter *param);
这个函数根据给定的参数和训练数 据构建并返回一个支持向量机模型。
结构体svm_problem将问题形式化:
struct svm_problem
{
int l;
double *y;
struct svm_node **x;
};
其中“l”表示训练数据的实例数,而“y”是一个数组,用于存放它们的目标值。(类型值用整型数据,回归值用实数)“x”是一个数组指针,每一个指针指向一个稀疏的训练向量(即一个svm_node数组)。
例如,如果我们有如下的训练数 据:
LABEL ATTR1 ATTR2 ATTR3 ATTR4 ATTR5
—– —– —– —– —– —–
1 0 0.1 0.2 0 0
2 0 0.1 0.3 -1.2 0
1 0.4 0 0 0 0
2 0 0.1 0 1.4 0.5
3 -0.1 -0.2 0.1 1.1 0.1
于是svm_problem的构成如下:
l = 5
y -> 1 2 1 2 3
x -> [ ] -> (2,0.1) (3,0.2) (-1,?)
[ ] -> (2,0.1) (3,0.3) (4,-1.2) (-1,?)
[ ] -> (1,0.4) (-1,?)
[ ] -> (2,0.1) (4,1.4) (5,0.5) (-1,?)
[ ] -> (1,-0.1) (2,-0.2) (3,0.1) (4,1.1) (5,0.1) (-1,?)
其中(索引,值)存储在结构“svm_node”中:
struct svm_node
{
int index;
double value;
};<