作为一个免费、公开、开源的数据挖掘工作平台,Weka集合了大量能承担数据挖掘任务的机器学习算法,包括预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化操作等;目前,Weka最新版本为weka-3-7-11,可以利用weka进行大数据的挖掘和分析处理。

  • WEKA的全名是怀卡托智能分析环境(Waikato     Environment for Knowledge Analysis),其源代码可从http://www.cs.waikato.ac.nz/ml/weka/ 得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。

  • 20058月,在第11ACM     SIGKDD国际会议上,怀卡托大学的WEKA小组荣获了数据挖掘和知识探索领域的最高服务奖, WEKA系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一。 WEKA的每月下载次数已超过万次。

wKioL1l6svSC0VxeAABEvy-sK2g902.jpg

  • Explorer    使用  WEKA  探索数据的环境。

  • Experimenter    运行算法试验、管理算法方案之间的统计检验的环境。

  • KnowledgeFlow    这个环境本质上和  Explorer 所支持的功能是一样的,但是它有一个可以拖放的     界 面。 它有 一 个优 势, 就 是支 持增 量 学 习(incremental learning)。

  • SimpleCLI    提供了一个简单的命令行界面,从而可以在没有自带命令行的操作系统中直接执行  WEKA  命令。