点击主界面的Explorer按钮后,显示界面Explorer界面:

初始打开时,只有Preprocess标签可以用
1.各个标签用途
(1)Preprocess(预处理):选择数据集,以不同方式对其进行修改。
(2)Classify(分类):训练用于分类或回归的学习方案,并对其进行评估。
(3)Cluster(聚类):学习数据集聚类方案。
(4)Associate(关联):学习数据关联规则,并对齐进行评估。
(5)Select attributes(选择属性):选择数据集中预测效果最好的部分属性。
(6)Visualize(可视化):查看不同的二维数据散点图,并与其进行互动。
在探索者界面的下部,有状态栏和日志按钮,状态栏可以让用户了解到现在进行到哪一步。还可以右击鼠标来显示内存信息(Memory information)以及运行垃圾回收器(run garbage collector)以清理内存。
内存信息中三个数值分别为空闲内存/全部内存/最大内存,单位是字节。
单击日志(Log)按钮,会打开可以滚动的日志窗口。
日志按钮右侧的小鸟,如果没有处理过程在运行,小鸟会坐下来打个盹。“x”符号右边的数字显示目前有多少个正在进行处理的进程,当系统空闲时,该数字为零,数字会随着正在进行处理进程数的增加而增加。当启动处理进程时小鸟会站起来不停走动。如果小鸟长时间站着不动,说明weka出现运行错误,此时用户需要关闭并重新启动探索者界面。
2.图像输出
weka中很多图像都可以保存为图像文件,保存方法:在按住Alt键和Shift键的同时,在要保存的图形上单击,启动保存文件对话框,进行图像文件的保存。
3.预处理
Preprocess标签页可以从文件、URL或数据库中加载数据集,并且根据应用要求和领域知识过滤掉不需要进行处理或不符合要求的数据。
3.1 加载数据
Open file按钮用于启动”打开“对话框,打开本地数据文件。Open URL按钮要求用户提供一个URL地址,使用HTTP协议从网络位置下载数据文件。Open DB按钮用于从数据库中读取数据,支持所有能够用JDBC驱动程序读取的数据库。
Open file按钮可以读取多种数据格式,包括.arff,.data,.names,.csv,.json,.libsvm,.m,.dat,.xrff,.gz。
Save按钮,可以将已加载的数据保存为Weka支持的文件格式。
由于存在多种数据格式,Weka提供了使用工具类进行转换,即转换器(converters),位于weka.core.converters包中。按照功能的不同转换器分为加载器和保存器,前者的java类名以Loader结束后者以Saver结束。
3.2当前关系
<

本文介绍了WEKA软件中的探索者界面使用方法,包括数据集的加载与预处理、属性和实例的过滤、数据可视化等功能。并通过具体示例展示了如何进行属性的添加与删除、离散化处理等操作。
最低0.47元/天 解锁文章
1558

被折叠的 条评论
为什么被折叠?



