最近在学习机器学习中的SVM算法,理论知识已经学的差不多了,现在是使用libsvm工具进行求解的阶段。在网上找了一点资料,然后自己做了个小的总结,希望可以帮到学习libsvm的新手。
一.首先说明一下关于分类问题的流程:训练--->得到model--->分类预测
训练:训练集——〉特征选取——〉训练——〉分类器
分类: 新样本——〉特征选取——〉分类——〉判决
二.libsvm简介:
1.LibSVM是以
源代码和
可执行文件两种方式给出的。
(1)如果是
Windows系列操作系统,可以
直接使用软件包提供的
程序(SVM\libsvm-3.20\windows,其中有四个可执行程序,svm-predict,svm-scale,svm-toy,svm-train),也可以进行修改编译;
(2)如果是
Unix类系统,
必须自己编译,软件包中提供了编译格式文件,个人在SGI工作站(操作系统IRIX6.5)上,使用免费编译器GNU C++3.3编译通过。
2.关于libsvm源码的说明:
Java --主要是应用于java平台
pathon --是用来参数优选的工具
svm-toy --一个可视化的工具,用来展示训练数据和分类界面,里面是源码,其编译后的 程序在windows文件夹下
tools --主要包含四个pathon文件,用来数据抽样(subset),参数优选(grid),集成测试(easy),数据检查(checkdata)
windows --包含libsvm四个exe程序包,我们所用到的库就是他们,里面还有个heart_scale,是一个样本文件,可以用记事本打开,用来测试用的。
其他的.h和.cpp文件都是程序的源码,可以编译出相应的exe文件。其中,最重要的是svm.h和svm.cpp文件,svm-predict,svm-scale.c和svm.train.c(还有一个svm-toy.c在svm-toy文件夹中)都是调用这个文件中的接口函数,编译后就是windows下相应的四个exe程序。