要使用程序方式使用weka,步骤如下:
一、在eclipse里新建一个java project:
1. 建立工程:单击菜单中file->new->java project,在弹出对话框的project name中起任意一个名字,此处假设是wekaTest。单击Finish按钮(在对话框底部)。
2. 建立package:在package Explorer中找到刚才新建的工程,在其上右键->New->package。在Name文本框里面输入名称,此处假设为Test。单击 Finish按钮。
3. 建立程序文件:在刚才新建的package上面右键->New->class,选中public static void main(String[] args)多选框,单击Finish。
二、在该工程中添加weka的引用:
1. package Explorer中工程名上右键,选择弹出菜单最后一项properties->在左面选中java Build Path->在右面的Library页面->单击Add External JARs…->浏览weka所在目录,将weka.jar添加进来,然后单击ok。
2. 在package Explorer中在双击Test文件,然后添加代码
import java.io.File;
import java.util.Arrays;
import weka.classifiers.Classifier;
import weka.classifiers.bayes.BayesNet;
import weka.classifiers.trees.J48;
import weka.classifiers.trees.RandomForest;
import weka.core.Instances;
import weka.core.converters.ArffLoader;
import weka.classifiers.Evaluation;
import java.util.Random;
public class HelloWorld {
public static void main(String[] args) throws Exception {
Classifier m_classifier = new BayesNet() ;
ArffLoader atf = new ArffLoader();
try {
File inputFile = new File(
"/home/xx/ml/weka-3-9-1/data/glass.arff");
atf.setFile(inputFile);
Instances instancesTest = atf.getDataSet(); // 读入测试文件
instancesTest.setClassIndex(instancesTest.numAttributes()-1);
double sum = instancesTest.numInstances(),
right = 0.0f;
m_classifier.buildClassifier(instancesTest); // 训练
for (int i = 0; i < sum; i++) {
if (m_classifier.classifyInstance(instancesTest.instance(i)) == instancesTest.instance(i).classValue()){
right++;
}
}
System.out.println("class1 classification precision:" + (right / sum));
Classifier m_classifier2 = new BayesNet() ;
Evaluation eval = new Evaluation(instancesTest);
eval.crossValidateModel(m_classifier2, instancesTest, 10, instancesTest.getRandomNumberGenerator(1));
System.out.println(eval.toSummaryString());
} catch (Exception e) {
e.printStackTrace();
}
}
}
四、运行一下试试。