Weka系统汇集了前沿的机器学习算法和数据预处理工具,以便用户能够快速灵活地将已有的成熟处理方法应用于新的数据集。
1、 处理方法
包括处理标准数据挖掘问题的所有方法:回归、分类、聚类、关联规则和属性选择。
2、 输入数据
- 通过以ARFF格式为代表的文件进行输入
- 直接读取数据库表
3、Weka主界面 Weka GUI Chooser
(1) 探索者(Explorer)
图形用户界面,通过选择菜单和填写表单,可以调用Weka的所有功能。
(2)实验者(Experimenter)
帮助用户解答实际应用分类和回归技术中遇到的一个基本问题。
(3)知识流(KnowledgeFlow)
使用增量(分批)方式的算法来处理大型数据集,用户可以定制处理数据流的方式和顺序。
按照一定顺序将代表数据源、预处理工具、学习算法、评估手段和可视化模块的各组件组合在一起,形成数据流。
(4)简单命令行(Simple CLI)
该界面用于和用户进行交互,可以直接执行Weka命令。