SVM算法应用综合练习
一、LibSVM制作鸳尾花数据集
(一)LibSVM概念
LibSVM libSVM是台湾林智仁(Chih-Jen Lin) 教授2001年开发的一套支持向量机库,这套库运算速度挺快,可以很方便的对数据做分类或回归。由于libSVM程序小,运用灵活,输入参数少,并且是开源的,易于扩展,因此成为目前国内应用最多的SVM的库。
(二)训练文本的格式
libSVM数据格式:
Label 1:value 2:value ….
Label:是类别的标识,可以自己随意定,比如-10,0,15。当然,如果是回归,这是目标值,就要实事求是了。Value:就是要训练的数据,从分类的角度来说就是特征值,数据之间用空格隔开。如果特征值为0,特征冒号前面的(姑且称做序号)可以不连续。从编程的角度来说,这样做可以减少内存的使用,并提高做矩阵内积时的运算速度。
(三)下载与安装
1.下载
官网下载页面
2.解压
将解压后的libsvm文件复制到对应的python环境下的 …/Lib/site-packages/ 目录下
(四)构建数据集
1.打开这个.exe文件**
2.画图
change切换颜色,画完后点击run,并保存为txt文件
(三)编码进行分类训练
1.通过IDEA新建一个Java项目,并新建一个libsvm包与test包
2.将下面的文件复制到刚建的libsvm包下
3.将下面文件复制到刚建的test包下
4.在test包下新建一个Test类并写入以下代码:
package test;
import java.io.IOException;
public class Test {
public static void main(String args[]) throws IOException {
//存放数据以及保存模型文件路径
String filepath = "D:\\iris\\";
/*
* -s 设置svm类型:默认值为0
* 0– C-SVC
* 1 – v-SVC
* 2 – one-class-SVM
* 3 –ε-SVR
* 4 – n - SVR
*
* -t 设置核函数类型,默认值为2
* 0 --线性核
* 1 --多项式核
* 2 -- RBF核
* 3 -- sigmoid核
*
* -d degree:设置多项式核中degree的值,默认为3
*
* -c cost:设置C-SVC、ε-SVR、n - SVR中从惩罚系数C,默认值为1;
*/
String[] arg = {
"-s","0","-c","10","-t","0",filepath+"iris.txt",filepath+"line.txt"};
String[] arg1 = {
filepath+"iris1.txt",filepath+"line.txt",filepath+"predict1.txt"};
System.out.println("----------------线性-----------------");
//训练函数
svm_train.main(arg);
svm_predict.main(arg1);
arg[5]="1";
arg[7]=filepath+"poly.txt";//输出文件路径
arg1[1]=filepath+"poly.txt";
arg1[2]=filepath+"predict2.txt";
System