Weka简介:http://www.wekacn.org/viewtopic.php?f=2&t=9&sid=091d5c33af94a62a547fa016d65659ec
Weka的GUI使用方法
1、WEKA主界面
2、点击“Explorer”进入
3、点击“Open file”,打开WEKA格式支持的文件(默认安装时的文件在安装路径的data文件夹下,后缀名 .arff)
4、选择一个文件打开,例如iris.arff
5、这个数据集可以用来训练一个分类器,这时我们选择界面中第一行的第二个选项卡,进入分类器生成的界面
这里可以选择分类器的种类“Classfier”,例如选择朴素贝叶斯分类器算法
训练选项,有四种,常用的是交叉验证,即把数据集分成若干份,1份作为验证集,其余部分作为训练集合。这样的方法保证了数据集的所有元素都被验证过。
如图所示,这里把数据集分为10份来进行训练。
下图显示,选择按照属性进行分类,点击start就开始了贝叶斯分类器训练
这个列表列出了计算的历史,方便后续对比使用
分类器的输出结果如图所示
结果中列出了分类器运行的信息,分类器训练的结果,分类器验证验证的结果、准确性计算等信息
6、最后看一下界面第一行的最后一个选项卡“visualize”
WEKA根据打开的数据属性做了可视化的处理,从而可以直观的开出哪些属性具有较高的区分度,为分类器使用。
如图所示,打开的数据集,包括了属性和分类的信息
3种类别用不同颜色表示出来。
可以从图中看出哪些属性的组合具有较好的区分度。