开始介绍Weka,先google一下,把Weka软件下载下来,安装完成之后,在Weka的安装目录中有一个weka.jar的包。
把包添加到工程中后,就可以调用weka中的函数了。
再介绍一点weka的基本知识,在weka的目录下,有一个data的文件夹,里面存放的是一些数据集,以第一个数据集contact-lenses.arff为例,用EditPlus或是别的编辑器打开数据集,以%开头的表示的是一些注释,@relation表示这个数据集的名字,@attribute表示属性的属性,@data后就是数据集了,一般来说最后一列是类别(在LibSVM中第一列是类别)。
下面我写了一个微不足道的一个weka的入门代码:
package com.cizito.weka.study;
import java.io.FileReader;
import weka.core.Instances;
public class InstanceTest {
public static void main(String[] args) throws Exception {
Instances instances = getFileInstances( "D:/ProgramFiles/Weka-3-6/data/contact-lenses.arff");
//把数据集全部输入出
//用numInstances可以获得数据集中有多少样本
for( int i = 0; i < instances.numInstances(); i++ ) {
//instance( i )是得到第i个样本
System.out.println( instances.instance( i ) );
}
}
public static Instances getFileInstances( String fileName ) throws Exception {
DataSource frData = new DataSource( fileName );
Instances data = frData.getDataSet();
return data;
}
}